© studocu 


Livro Alvaro Crosta Processamento Digital de Imagens de 
Sensoriamento Remoto 


Digitalizar para abrir em Studocu 


A Studocu não é patrocinada ou endossada por nenhuma faculdade ou universidade 
Baixado por Daiane Cardoso Lopes (daiane. lopes seducam.pro.br) 


j 
Me 


f 


a -> 
h l ata ti 
EA 4 
p . rA “ P > 
D i P Ê 
, 4 

4 

N 


- Ar 1d 
VERA PS 


LÁ 


ALVARO P. CROSTA 


Processamento Digital de Imagens 
de Sensoriamento Remoto 


Baixado por Daiane Cardoso Lopes (daiane .lopes(seducam.pro.br) 


UNICAMP 


PROCESSAMENTO DIGITAL DE 


IMAGENS DE SENSORIAMENTO 


REMOTO 


(edição revisada) 


Alvaro Penteado Crósta 


Instituto de Geociências 
Departamento de Metalogênese e Geoquímica 


Baixado por Daiane Cardoso Lopes (daiane.lopes(seducam.pro.br) 


4º Reimpressão 2002 


Ficha catalográfica elaborada pela 
Biblioteca Central - UNICAMP 


Crósta, Alvaro Penteado 


C884p Processamento digital de imagens de sensoriamento 
remoto / Alvaro Penteado Crósta. - ed. rev. - Campinas, SP: 
IG/UNICAMP, O 1992. 

170p. 


1. Sensoriamento Remoto. 2. 
Proces-samento de imagens-Técnicas digitais. 1. 
Título. 


20. CDD - 621.367 8 
621.381 958 


ISBN 85 853 690 27 


Índices para catálogo sistemático: 


1. Sensoriamento remoto 621.367 8 
2. Processamento de imagens - Técnicas digitais 621.381 958 


Capa: Imagem LANDSAT Thematic Mapper da órbita 218, ponto 75 (região 
da Represa de Furnas, MG), Banda 4, processada para realce 


direcional de estruturas de direção noroeste, através de filtro de 
convolução do tipo "compass" ou de Prewitt. 


ISBN 85-85369-02-7 


Baixado por Daiane Cardoso Lopes (daiane .lopes(seducam.pro.br) 


À Vera, por seu entusiasmado apoio e 
constante companheirismo. 


Ao Guilherme, como uma pequena compensação pelo tempo que deixamos 
de passar juntos durante a preparação deste livro. 


A Alvaro e Elcia, por toda uma 
vida de estímulo. 


Baixado por Daiane Cardoso Lopes (daiane .lopes(seducam.pro.br) 


ÍNDICE 


Prefácio 
Apresentação 


1. 
2. 


Introdução 
Características das imagens de sensoriamento remoto 
2.1 Estrutura das imagens de sensoriamento remoto 
2.2 Resolução das imagens de sensoriamento remoto 
O histograma de uma imagem 
3.1 Histograma uni-dimensional 
3.2 Histograma cumulativo 
3.3 Histogramas multi-dimensionais 
Aumento de contraste 
4.1 Introdução 
4.2 A função de transferência de contraste 
4.3 Aumento linear de contraste 
4.4 Aumento bilinear de contraste 
4.5 Aumentos não-lineares de contraste 
4.6 Aumento "quase-linear" de contraste 
4.7 Conclusões 
A cor no processamento digital de imagens 
5.1 Introdução 
5.2 Ateoria básica das cores: o espaço RGB 
5.3 As cores e o sistema visual humano 
5.4 Composições coloridas 
5.5 Aumento de contraste em composições coloridas 
5.6 A correlação espectral e suas consequências na composição colorida 
5.7 A transformação HSI 
5.8 Pseudo-cor 
Filtragem de frequências espaciais 
6.1 Introdução 
6.2 Filtragem com a janela móvel 
6.3 Filtros passa-baixas ou de suavização 
6.3.1 Filtro de Média 
6.3.2 Filtro de Média Ponderada 
6.3.3 Filtro de Moda 
6.3.4 Filtro de Mediana 
6.4 Filtros passa-altas ou de realce de bordas 


Baixado por Daiane Cardoso Lopes (daiane .lopes(seducam.pro.br) 


Página 


08 
09 
13 
17 
19 
21 
25 
27 
30 
31 
35 
37 
39 
41 
44 
46 
50 
51 
53 
55 
56 
58 
59 
61 
62 
62 
66 
69 
71 
73 
75 
75 
76 
77 
77 
77 


10. 


6.4.1 Filtros Laplacianos 
6.4.2 Filtros Laplacianos+Original 
6.5 Filtros direcionais 
6.6 Remoção de ruído por convolução 
Operações aritméticas em imagens 
7.1 Introdução 
7.2 Adição de imagens 
7.3 Subtração de imagens 
7.4 Multiplicação de imagens 
7.5 Divisão de imagens (razão de bandas) 
Classificação 
8.1 Introdução 
8.2 O espaço de atributos 
8.3 Conceitos básicos de classificação multiespectral 
8.4 Fatiamento de níveis 
8.5 Classificação supervisionada 
8.5.1 Método do paralelepípedo 
8.5.2 Método da distância mínima 
8.5.3 Método da máxima verossimilhança (MaxVer) 
8.6 Classificação não-supervisionada 
8.7 Homogeneização de temas em imagens classificadas 
Análise por Principais Componentes 
9.1 Introdução 
9.2 Correlação de imagens 
9.3 Variância e covariância de imagens 
9.4 A transformação por principais componentes 
9.5 Aumento de contraste e composições coloridas de principais componentes 
9.6 Interpretação de imagens Pcs 
9.7 Modificações da Análise por Principais Componentes 
9.7.1 Análise Canônica 
9.7.2 Realce por decorrelação 
Correção Geométrica e Registro de Imagens 
10.1 Introdução 
10.2 Fontes de distorção em imagens orbitais 
10.3 Correção geométrica 
10.3.1 Transformação baseada no modelo de geometria orbital 
10.3.2 Transformação baseada em pontos de controle no terreno 
10.4 Re-amostragem por interpolação 
10.5 Registro de imagens 


Referências 


Baixado por Daiane Cardoso Lopes (daiane.lopes@seducam.pro.br) 


78 
78 
78 
80 
81 
83 
84 
85 
87 
88 
95 
97 
97 
101 
102 
104 
105 
107 
109 
114 
119 
123 
125 
126 
129 
131 
133 
134 
136 
136 
137 
139 
141 
142 
143 
143 
144 
145 
148 
151 


Baixado por Daiane Cardoso Lopes (daiane .lopes(seducam.pro.br) 


PREFÁCIO 


O autor deste livro, Prof. Alvaro Penteado Crósta, formou-se em Geologia 
pela Universidade de São Paulo, em 1977, fazendo logo a seguir seu mestrado em 
sensoriamento remoto no Instituto de Pesquisas Espaciais (INPE). Mestre em 1982, 
trabalhou na iniciativa privada, retornando em seguida à academia, tendo se 
transferido em 1984 para o Instituto de Geociências da UNICAMP, então em fase 
de implantação. Fiel à sua linha de pesquisa preferida, fez seu doutorado em 
Sensoriamento Remoto no Centre for Remote Sensing do Imperial College, 
Universidade de Londres, obtendo o título no início de 1990. Em sua tese, 
estudando uma área brasileira, mais precisamente mineira, desenvolveu com 
sucesso uma abordagem metodológica própria, trazendo em sua bagagem de volta 
ao Brasil um notável conhecimento de processamento digital de imagens de 
sensoriamento remoto. 

A formação inicial do autor em sensoriamento remoto deu-se ainda no 
período heróico dessa técnica, ao menos no Brasil. Os mestres, muito poucos, 
eram autodidatas. O laboratório de processamento, o único no país. Hoje, Alvaro 
tem em suas mãos na UNICAMP um poderoso sistema de processamento de 
imagens e pode dar vazão à sua vontade de pesquisar e ensinar: os tempos já não 
são tão heróicos e o mestre - ele - já não é autodidata, mas dono de uma sólida 
formação. E capaz de dominar uma linguagem que permitiu a elaboração deste 
livro, de leitura fácil mas rigoroso na conceituação. Em suma, um livro que permitirá 
aos jovens estudantes e pesquisadores um rápido avanço no processamento digital 
de imagens de sensoriamento remoto. 

Ao leitor, boa sorte em suas pesquisas e aplicações. E também um alerta. O 
fato de poderem começar mais à frente não implica em objetivo alcançado. Ao 
contrário, espera-se que avancem mais, muito mais, na evolução do conhecimento. 


São Paulo, Maio de 1992. 


Prof. Dr. Teodoro Isnard Ribeiro de Almeida 
Instituto de Geociências - USP 
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APRESENTAÇÃO 


Imagens de sensoriamento remoto vêm se tornando cada vez mais parte do nosso 
dia-a-dia. A previsão meteorológica é ilustrada nos jornais e na televisão por imagens de 
satélites meteorológicos, regiões de conflitos internacionais são mostradas na mídia através de 
imagens obtidas do espaço, da mesma forma que imagens de satélite passam cada vez mais a 
ilustrar livros, catálogos, calendários, posters e muitas outras formas de comunicação visual. 

Do ponto de vista técnico-científico, imagens de sensoriamento remoto vem servindo de 
fontes de dados para estudos e levantamentos geológicos, ambientais agrícolas, cartográficos, 
florestais, urbanos, oceanográficos, entre outros. Acima de tudo, as imagens de sensoriamento 
remoto passaram a representar uma das únicas formas viáveis de monitoramento ambiental 
em escalas locais e globais, devido à rapidez, eficiência, periodicidade e visão sinóptica que as 
caracterizam. Neste momento em que a humanidade começa a encarar seriamente a 
necessidade de monitorar as mudanças globais que vem ocorrendo na superfície do planeta, o 
sensoriamento remoto aparece como uma das ferramentas estratégicas para o futuro. 

Por isso, um número progressivo de países e consórcios internacionais vem se 
envolvendo em programas espaciais voltados ao lançamento e operação de satélites de 
levantamento e monitoramento de recursos naturais, incluindo o Brasil, e para o 
desenvolvimento de sofisticados sistemas sensores aeroportados. Ao mesmo tempo, os 
sensores aperfeiçoam-se rapidamente, no sentido de atender a demandas mais sofisticadas, 
por maiores resoluções dos dados gerados. Uma das primeiras consequências disto é o 
aumento brutal na quantidade de dados sendo gerados continuamente, dados esses quase 
sempre representados por imagens digitais. 

Todo esse avanço ficaria sem sentido se não ocorresse simultaneamente a 
contrapartida em relação às técnicas de processamento das informações contidas nas imagens 
de sensoriamento remoto. A necessidade de processamento advém do fato da imagem conter 
uma quantidade muito maior de informações do que a que o olho humano conseguiria 
perceber. Faz-se necessário portanto torná-la mais visível, ou representá-la de uma forma pela 
qual ela possa ser percebida. Justamente aí se coloca o papel fundamental do processamento 
de imagens, no sentido de traduzir essa informação para o intérprete, extraindo dela apenas a 
parte essencial aos fins determinados. 

Tendo se iniciado através da manipulação de fotos aéreas, obtidas por balões ao final 
do século passado, as técnicas de processamento evoluíram velozmente em tempos mais 
recentes, através de sua migração para sistemas de computação digital. Os anos 80 trouxeram 
a explosão tecnológica dos processadores digitais e uma queda acentuada nos custos 
envolvidos. Esse fatores causaram fortes reflexos na computação gráfica, na qual se baseia o 
processamento digital de imagens. Em consequência, os sistemas especializados no 
processamento de imagens de sensoriamento remoto ficaram ao alcance de uma comunidade 
muito maior de usuários, sendo comum encontrá-los hoje nas universidades, instituições 
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públicas, empresas e até mesmo escolas. 

O processamento digital de imagens de sensoriamento remoto trata especificamente 
das técnicas utilizadas para identificar, extrair, condensar e realçar a informação de interesse 
para determinados fins, a partir de uma enorme quantidade de dados que usualmente 
compõem essas imagens. 

O texto que se segue foi elaborado como um roteiro de curso de pós-graduação, 
ministrado pela primeira vez pelo autor em 1991 no Instituto de Geociências da Universidade 
Estadual de Campinas e na Escola Politécnica da Universidade de São Paulo. Seu principal 
objetivo é o de suprir parcialmente a carência de literatura em português, voltada 
especificamente para o usuário de sensoriamento remoto, que deseja extrair o máximo 
possível da informação contida em imagens digitais. 

Optou-se por abordar as principais técnicas de processamento digital de imagens sob o 
ponto de vista dos conceitos teóricos envolvidos e não dos conceitos matemáticos. Além disso, 
procurou-se tratar dos aspectos de aplicação dessas técnicas à solução de problemas comuns 
em processamento de imagens de sensoriamento remoto, buscando assim atingir a maior parte 
dos usuários dessa técnica. 

Um texto sobre processamento de imagens de sensoriamento remoto deveria, 
idealmente, conter fartas ilustrações. Infelizmente, não é este o caso, principalmente devido 
aos altos custos envolvidos na reprodução de imagens coloridas. Em que pese essa grande 
limitação, espera-se que o texto consiga cumprir o seu objetivo maior, qual seja o de tornar 
claros os conceitos por trás das técnicas de processamento digital de imagens, levando a uma 
melhor compreensão de seus resultados. 

A preparação deste livro foi motivada pelo entusiasmo de algumas pessoas e pelo 
apoio de instituições, aos quais são devidos agradecimentos. Dentre eles estão: 

> os alunos e colegas dos cursos de Mestrado em Geociências do Instituto de Geociências 
da UNICAMP e de Pós-Graduação em Geoprocessamento da Escola Politécnica da USP, 
turmas de 1991, pela sua colaboração; 

> Prof. Dr. Teodoro |. Ribeiro de Almeida, do IG-USP, pela leitura dos originais e 
sugestões; 

>o Instituto de Geociências da UNICAMP, na pessoa de seu Diretor, Prof. Dr. Bernardino 
R. Figueiredo, por possibilitar a publicação deste livro; 

> a Fundação de Amparo à Pesquisa no Estado de São Paulo (FAPESP) e a Coordenação 
de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) e o Conselho Nacional de 
Desenvolvimento Científico e Tecnológico (CNPq), pelas bolsas e auxílios concedidos, 
graças aos quais pode-se consolidar os conhecimentos de processamento digital de 
imagens. 


O Autor 
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A função primordial do processamento digital de imagens de sensoriamento 
remoto é a de fornecer ferramentas para facilitar a identificação e a extração da 
informação contidas nas imagens, para posterior interpretação. Nesse sentido, 
sistemas dedicados de computação são utilizados para atividades interativas de 
análise e manipulação das imagens brutas. O resultado desse processo é a 
produção de outras imagens, estas já contendo informações específicas, extraídas 
e realçadas a partir das imagens brutas. 

A informação de interesse é caracterizada em função das propriedades dos 
objetos ou padrões que compõem a imagem. Portanto, extrair informação de 
imagens envolve o reconhecimento de objetos ou padrões. A maior parte dessa 
atividade requer grande capacidade de cognição por parte do intérprete, devido à 
complexidade dos processos envolvidos e à falta de algoritmos computacionais 
precisos o bastante para realizá-lo de forma automática. 

O sistema visual humano possui uma notável capacidade de reconhecer 
padrões. Contudo, ele dificilmente é capaz de processar o enorme volume de 
informação presente numa imagem. Vários tipos de degradações e distorções, 
inerentes aos processos de aquisição, transmissão e visualização de imagens, 
contribuem para limitar ainda mais essa capacidade do olho humano. O objetivo 
principal do processamento de imagens é o de remover essas barreiras, 
inerentes ao sistema visual humano, facilitando a extração de informações 
a partir de imagens. Nesse contexto, o processamento digital deve ser encarado 
como um estágio preparatório, embora quase sempre obrigatório, da atividade de 
interpretação das imagens de sensoriamento remoto. 

Operações de processamento de imagens podem ser implementadas por 
métodos ópticos, fotográficos e digitais. A precisão e a flexibilidade de sistemas de 
computação tornaram os métodos digitais os mais eficazes. Além disso, a enorme 
evolução ocorrida no campo da computação gráfica, a partir da qual nasceu o 
processamento de imagens, aliada à queda experimentada nos últimos anos pelos 
custos de computadores e periféricos, tornaram os sistemas de processamento de 
imagens mais acessíveis. Calcula-se que os custos de aquisição de um sistema de 
processamento de imagens tenha caído da casa das centenas de milhares de 
dólares para a das dezenas, nos últimos 10 anos. A principal razão da queda é que 
o intensivo trabalho de computação exigido por esse tipo de processamento, que 
anteriormente requeria o uso de computadores de grande porte e custo (de 
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"mainframes" a mini-computadores), pode ser feito hoje em microcomputadores ou 
estações de trabalho ("workstations"). Estes têm um poder de processamento 
superior ao dos computadores de maior porte de poucos anos atrás, a um custo 
muito inferior. É possível encontrar sistemas de processamento de imagens com 
razoável grau de sofisticação baseados até mesmo em microcomputadores tipo 
PC, com custos de poucos milhares de dólares. 

Umas das consequências dessa queda nos custos foi uma grande 
disseminação de sistemas de processamento de imagens de sensoriamento 
remoto, ocorrida principalmente nos países desenvolvidos. Eles são hoje utilizados 
no ensino de alunos de escolas e universidades, em pequenas empresas de 
prestação de serviço, além dos tradicionais usuários de maior porte (empresas e 
órgãos estatais e grandes corporações privadas). Infelizmente essa ainda não é a 
situação encontrada no Brasil, onde as restrições à importação, a ausência de uma 
economia de escala e os investimentos insuficientes no setor de computação em 
geral, e no da computação gráfica em particular, tem freado essa tendência 
observada em outros países, de expansão no número de sistemas de 
processamento. Dessa forma, a maior utilização de produtos de sensoriamento 
remoto no Brasil ocorre ainda na forma de imagens impressas em papel fotográfico, 
o que não permite a utilização plena de toda a informação nelas contidas. Outra 
consequência dessa falta de disponibilidade de sistemas de processamento é a 
carência de recursos humanos capacitados nessa área. 

A maioria das técnicas aqui abordadas podem ser usadas para o 
processamento de quaisquer tipos de imagens digitais, sejam elas fotografias de 
qualquer natureza, imagens médicas (raios-X, tomografia, ressonância magnética 
nuclear), fotomicrografias e mesmo dados geo-referenciados de qualquer natureza 
(topografia, geoquímica, geofísica, etc.). O único pré-requisito para que dados geo- 
referenciados sejam processados através das técnicas aqui tratadas é que eles 
sejam estruturados digitalmente em uma malha ou grid regular e quantificados 
geralmente em 6, 8 ou 12 bits, para efeito de visualização em monitores de vídeo. 

Neste livro tratar-se-á apenas do processamento digital voltado 
especificamente para imagens geradas por sensores remotos. Estes incluem os 
sistemas que adquirem imagens da superfície terrestre a bordo de plataformas 
aéreas (aviões) ou orbitais (satélites). As imagens de sensores remotos possuem 
quase sempre uma característica que as diferencia de outras imagens digitais: o 
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fato de serem multiespectrais. Imagens multiespectrais são aquelas adquiridas em 
diferentes porções do espectro eletromagnético, geralmente variando da porção 
visível (VIS), passando pelo infravermelho próximo (NIR), médio (MWIR) e de 
comprimento de onda curto (SWIR), e chegando até o infravermelho termal (TIR) e 
microondas. Isso faz com que seja necessário o uso intensivo de técnicas de 
processamento baseadas em métodos estatísticos, principalmente no que diz 
respeito à estatística multi-variada. Contudo, nem todos os sensores remotos 
existentes produzam imagens multiespectrais, como por exemplo os sistemas de 
radar atualmente em operação ou o modo pancromático do SPOT/HRV. 
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As imagens coletadas por sensores remotos possuem algumas 
características que as diferenciam de outras imagens digitais e que são essenciais 
para se entender os fundamentos do processamento digital. Entre essas 
características estão sua estrutura e sua resolução. 


2.1 Estrutura das imagens de sensoriamento remoto 


As imagens de sensoriamento remoto, por sua natureza digital ou discreta, 
são constituídas por um arranjo de elementos sob a forma de uma malha ou grid. 
Cada cela desse grid tem sua localização definida em um sistema de coordenadas 
do tipo "linha e coluna”, representados por "x" e "y", respectivamente. Por 
convenção , a origem do grid é sempre no seu canto superior esquerdo. O nome 
dado a essas celas é pixel, derivado do inglês “picture element”. Para um mesmo 
sensor remoto, cada pixel representa sempre uma área com as mesmas dimensões 
na superfície da Terra. 

Cada cela possui também um atributo numérico "z", que indica o nível de 
cinza dessacela, que obviamente vai variar do preto ao branco; esse nível de cinza 
é conhecido em inglês por DN, de "digital number". O DN de uma cela representa 
a intensidade da energia eletromagnética (refletida ou emitida) medida pelo sensor, 
para a área da superfície da Terra correspondente ao tamanho do pixel. Deve ser 
ressaltado que o DN de um pixel corresponde sempre à média da intensidade da 
energia refletida ou emitida pelos diferentes materiais presentes nesse pixel. 

Uma imagem digital pode então ser vista como uma matriz, de dimensões 
xlinhas por y colunas, com cada elemento possuindo um atributo z (nível de cinza). 
No caso das imagens de sensoriamento remoto, essas matrizes possuem 
dimensões de até alguns milhares de linhas e de colunas (o Landsat gera imagens 
de 6.550 x 6.550 elementos, o que significa mais de 42 milhões de pixels para cada 
banda!). 

A Figura 2.1 exemplifica uma imagem bastante simples, composta apenas 
por áreas quase brancas e quase pretas, e sua respectiva matriz numérica, 
representando a forma pela qual essa imagem seria utilizada no processamento 
digital. 
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Figura 2.1 - Exemplo de uma imagem simples (cruz), mostrada à direita em sua forma digital, 
como uma matriz numérica. Nesta, cada cela ou "pixel" possui uma localização definida por linha e 
coluna e o valor de cinza correspondente, que varia de O (preto) a 255 (branco). O pixel da 1º linha 
e 1º coluna da imagem à esquerda tem um DN igual à 20 (quase preto), enquanto o pixel da 1º linha 
e 4º coluna possui um DN igual à 230 (quase branco). 


Vale lembrar que qualquer imagem, mesmo não digital (como uma fotografia 
aérea, por exemplo), pode ser transformada em imagem digital através de um 
processo conhecido por digitalização. Esse processo é implementado através de 
um tipo de equipamento periférico denominado "scanner", que transforma uma 
imagem analógica (fotografias, mapas, etc.) em uma matriz com o número de linhas 
e colunas e o tamanho de cada cela pré-definidos, atribuindo para cada cela um 
valor de nível de cinza proporcional à tonalidade da imagem original. Essa matriz é 
então convertida para um formato digital gráfico, podendo ser lida e manipulada por 
sistemas de processamento digitais. Existem vários tipos de “scanners”, desde 
simples modelos de mão, geralmente utilizados apenas para atividades de 
editoração eletrônica em microcomputadores, até sofisticados sistemas de cilindro 
rotatório com leitura a feixe de laser, apropriados para digitalização de mapas e 
fotos aéreas por evitarem distorções geométricas. 
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2.2 Resolução das imagens de sensoriamento remoto 


O termo resolução em sensoriamento remoto se desdobra na verdade em 
três diferentes (e independentes) parâmetros: resolução espacial, resolução 
espectral e resolução radiométrica. 

A resolução espacial é definida pela capacidade do sistema sensor em 
"enxergar" objetos na superfície terrestre; quando menor o objeto possível de ser 
visto, maior a resolução espacial. A maneira mais comum de se determinar a 
resolução espacial de um sensor é pelo seu campo instantâneo de visada ou 
IFOV. Este campo é determinado pelas propriedades geométricas do sistema 
sensor e define a área do terreno imageado que é "vista" pelo instrumento sensor 
de uma dada altitude e a um dado momento. O IFOV é medido pelas dimensões da 
área vista no terreno e, de uma forma simplificada, ele representa o tamanho do 
pixel (Figura 2.2). Deve ser mencionado que o IFOV, e consequentemente a 
resolução espacial, é um conceito teórico, visto que existem variações na altitude 
da órbita dos satélites que provocam mudanças no IFOV (mas não no tamanho do 
pixel, que é fixo e é determinado pelo intervalo de amostragem do sinal recebido 
pelo sensor). 

A resolução espectral é um conceito inerente às imagens multiespectrais de 
sensoriamento remoto. Ela é definida pelo número de bandas espectrais de um 
sistema sensor e pela largura do intervalo de comprimento de onda coberto por 
cada banda. Quanto maior o número de bandas e menor a largura do intervalo, 
maior é a resolução espectral de um sensor. O conceito de banda, pode ser 
exemplificado no caso de duas fotografias tiradas de um mesmo objeto, uma em 
branco-e-preto e a outra colorida; a foto branco-e-preto representa o objeto em 
apenas uma banda espectral, enquanto a foto colorida representa o mesmo objeto 
em três bandas espectrais, vermelha, azul e verde que, quando combinadas por 
superposição, mostram o objeto em cores. 
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Figura 2.22 - O campo instantâneo de visada 
(IFOV) de um sensor define o tamanho do pixel e, 
consequentemente, a resolução espacial do 
mesmo. O IFOV é por sua vez definido pelo 
diâmetro do campo instantâneo de visada angular 
a do sensor. 


A resolução radiométrica é dada pelo número de níveis digitais, 
representando níveis de cinza, usados para expressar os dados coletados pelo 
sensor. Quanto maior o número de níveis, maior é a resolução radiométrica. Para 
entender melhor esse conceito, pensemos numa imagem com apenas 2 níveis 
(branco e preto) em comparação com uma imagem com 32 níveis de cinza entre o 
branco e o preto; obviamente a quantidade de detalhes perceptíveis na segunda 
será maior do que na primeira e portanto a segunda imagem terá uma melhor 
resolução radiométrica. A Figura 2.3 compara duas imagens com resoluções 
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radiométricas diferentes. O número de níveis é comumente expresso em função do 
número de dígitos binários ("bits") necessários para armazenar em forma digital o 
valor do nível máximo. O valor em bits é sempre uma potência do número 2; desse 
modo, "6 bits" quer dizer 2º = 64 níveis. Os sistemas sensores mais comuns, dos 
satélites LANDSAT e SPOT, possuem resolução radiométrica variando entre 6e 8 
bits, o que significa de 64 a 256 níveis de cinza. O sistema visual humano não é 
muito sensível a variações em intensidade, de tal modo que dificilmente são 
percebidas mais do que 30 diferentes tons de cinza numa imagem; o computador, 
por sua vez, consegue diferenciar qualquer quantidade de níveis, razão pela qual 
torna-se importante ter imagens de alta resolução radiométrica. 


a) b) 
Figura 2.3 


a) Imagem com resolução radiométrica de 1 bit (2 níveis de cinza apenas); 
b) a mesma imagem, com resolução radiométrica de 5 bits (32 níveis de cinza). 
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Em processamento de imagens, trabalha-se sempre com os tons de cinza 
(DNs) atribuídos aos pixels de uma imagem. O histograma é uma das formas mais 
comuns de se representar a distribuição dos DNs de uma imagem, e possivelmente 
a mais útil em processamento digital de imagens. Ele fornece a informação sobre 
quantos pixels na imagem possuem cada valor possível de DN (que, no caso das 
imagens de 8 bits, variam de 0 a 255) ou, de forma equivalente, qual a proporção 
da imagem que corresponde a cada valor de DN. Os histogramas são também 
conhecidos como distribuição de intensidades e função de densidade de 
probabilidade (PDF). Esse último termo advém do fato de que, estatisticamente, 
o histograma representa, neste caso, a probabilidade de se achar um DN de um 
dado valor dentro de uma imagem. 

Outro ponto importante com relação a histogramas é que eles representam 
dados digitais, também chamados de discretos. Assim sendo, a distribuição de 
intensidades é representada por colunas discretas, que não podem ser divididas ou 
"quebradas", correspondentes a números inteiros (em contraposição a números 
fracionários). Esse conceito assume importância ao se tratar de realce de contraste 
em imagens. 


3.1. Histograma uni-dimensional 


No caso do histograma de apenas uma banda, ou uni-dimensional, a 
representação pode ser uma tabela ou um gráfico contendo o número de pixels 
atribuído a cada um dos possíveis DNs. Note-se que o histograma pode ser 
calculado para a imagem inteira ou apenas para uma porção da imagem. Neste 
caso, é necessário que o sistema de processamento utilizado seja capaz de 
oferecer essa opção ao usuário, o que geralmente é feito graficamente, através da 
especificação interativa da área para a qual se quer adquirir o histograma. É claro 
que o histograma da imagem inteira será diferente do histograma de uma porção 
da mesma imagem, uma vez que as propriedades estatísticas das intensidades de 
uma imagem são ditas não-estacionárias. 

Ao se observar o histograma de uma imagem, tem-se uma noção instantânea 
sobre as características da mesma (Figura 3.1). A forma do histograma fornece 
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informações de grande importância no caso das imagens de sensoriamento remoto, 
tais como intensidade média e espalhamento dos valores de DN; este último, por 
sua vez, dá a medida do contraste de uma imagem: quanto maior o espalhamento 
ao longo do eixo dos DNs, maior o contraste da imagem. 


Frequencia (nº de pixels) 


0 SE y 255 
Niveis de cinza (DNs) 


Figura 3.1 - Histograma uni-dimensional (uma única banda) de uma 
imagem de 8 bits. A altura da barra para cada intervalo de DN indica a 
frequência de pixels com esse tom de cinza na imagem. O espalhamento 
ao longo do eixo dos DNs é diretamente proporcional ao contraste da 
imagem. 


É importante notar que o histograma de uma imagem não contém nenhuma 
informação espacial sobre a imagem - por exemplo, onde está localizado um pixel 
com determinada intensidade em relação a outro pixel com qualquer outra 
intensidade. Quando se computa a distribuição de intensidades (DNs) de uma 
imagem, essa informação espacial não é necessária, sendo essa distribuição 
tratada como uma longa lista de números aleatórios. 

Uma imagem de satélite contendo áreas cobertas por água e outras cobertas 
por solo (por exemplo, uma região costeira) vai ter seu histograma tipicamente bi- 
modal. Os pixels correspondentes à água, mais escuros, vão aparecer agrupados 
perto da origem, enquanto os demais vai se espalhar de forma menos pronunciada 
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pelo restante do intervalo de DNs (Figura 3.2a). Uma imagem de uma área 
homogênea (uma monocultura em terreno plano, por exemplo), com um baixo 
contraste, vai produzir um histograma com um único e proeminente pico (Figura 
3.2). Por outro lado, imagens contendo diferentes tipos de cobertura superficial 
mostrarão picos múltiplos e, se estes tiverem diferenças significativas em seus 
valores médios de resposta espectral, serão claramente separados no histograma. 
Desse modo, ao observar-se a forma do histograma, tem-se uma espécie de 
aproximação sobre as características espectrais da área imageada. O processo de 
entendimento do histograma de uma imagem é a base necessária para se aplicar 
as funções de realce ou aumento de contraste, abordadas mais adiante. 


0 255 0 255 
A) 


Figura 3.2 - A figura A é um histograma bi-modal, representando uma imagem com dois 
grupos contrastantes de pixels, sendo um mais claro e o outro mais escuro; a Figura B é um 
histograma uni-modal, de uma imagem cuja maioria dos pixels possui tonalidades médias de 
cinza, com a minoria restante distribuída entre tons claros e escuros. 


dl, M TR 
B) 


Alguns conceitos estatísticos básicos são úteis ao se tratar com histogramas. 
São eles: 
- Média: representa a média aritmética de um conjunto 
de valores (DNs, por exemplo); num histograma, é o 
"centro de gravidade" do mesmo (Figura 3.3); 
- Moda: representa o valor mais comum de um conjunto 
de valores; num histograma, é o ponto mais alto do 
gráfico (Figura 3.3). 


33 


Baixado por Daiane Cardoso Lopes (daiane.lopes(seducam.pro.br) 


A. P. Crósta Processamento Digital de Imagens de Sensoriamento Remoto 


da 
Media 


tl. dl. 
A) B) 
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Figura 3.3 - Histogramas uni e bi-modal da Figura 3.2, com a indicação dos 
respectivos valores de moda e média. 


3.2. Histograma cumulativo 


Uma outra maneira de se representar a função de densidade de 
probabilidade (PDF) é o histograma cumulativo (Figura 3.4). Neste, plota-se a 
frequência cumulativa dos pixels com determinado DN contra os valores de DNs. 
Para cada valor de DN, a frequência cumulativa é aquela do DN mais as frequências 
de todos os DNs abaixo dele. Neste caso, a inclinação da curva do gráfico é a 
medida do contraste, sendo que as heterogeneidades se mostram como quebras 
na curva. 


34 


Baixado por Daiane Cardoso Lopes (daiane.lopes(seducam.pro.br) 


A. P. Crósia Processamento Digital de Imagens de Sensoriamento Remoto 
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DN 


Frequencia Cumulativa 


DN 


Figura 3.4 - Histograma (a) e histograma cumulativo (b) de uma 
imagem (Adapt. de Drury, 1987) 


3.3 Histogramas multi-dimensionais 


Imagens multiespectrais podem ser expressas como histogramas multi- 
dimensionais, sendo o de 2 dimensões o mais simples deles. Este chama-se 
scattergrama e são plots bivariados dos DNs de uma banda contra os DNs de uma 
outra banda. Eles mostram visualmente o grau de correlação entre as duas bandas 
consideradas e identificam as situações em que a superfície mostra claramente 
diferentes tipos de resposta nas duas bandas. A densidade de ocorrência de pixels 
nesse espaço bidimensional é uma medida da coincidência entre os picos dos 
histogramas individuais. Dados altamente correlacionados, ou classes de materiais 
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superficiais que possuem aparência similar em duas bandas de uma mesma 
imagem, plotam próximo a linhas retas nos scattergramas. Dados pouco 
correlacionados aparecem como nuvens de pontos pouco densas, de formato 
indefinido, nos scattergramas, ocupando uma área maior no espaço bidimensional. 


255 


Randa ; 


DNs 


R 
Randa 2 


0 255 


Figura 3.5 - A figura da esquerda é uma representação em 3 dimensões da distribuição de 
frequencia de duas imagens hipotéticas, em que as maiores alturas do gráfico indicam maiores 
frequencias de pixels com o mesmo DN nas duas imagens. A figura da direita é o scattergrama 
dessas mesmas duas imagens, com a região de maior frequencia representada pela pequena área 
escura na parte superior direita do gráfico; o alongamento ao longo da direção 60º indica a existência 
de correlação entre as duas imagens. (Adapt. de Niblack, 1986) 


Scattergramas são úteis na avaliação do grau de correlação entre pares de 
imagens e na decisão sobre tipos de técnicas de aumento de contraste a serem 
aplicadas a imagens multi-espectrais, para se produzir imagens coloridas 
realçadas. Contudo, sua maior importância reside no fato de que eles podem ser 
descritos estatisticamente e manipulados para servirem de base para classificação 
estatística e para análise estatística multi-variada de imagens multiespectrais de 
sensoriamento remoto, o que é tratado no Capítulo 8. 
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4.1 Introdução 


As imagens de sensoriamento remoto são adquiridas pelos sistemas 
sensores com uma determinada resolução radiométrica, que é normalmente de 
6 ou 8 bits. Neste último caso, as imagens possuem, teoricamente, 256 valores 
de cinza, entre o preto e o branco. Contudo, dificilmente os dados contidos numa 
imagem de satélite espalham-se por todo o intervalo possível de níveis de cinza, 
sendo o mais comum a concentração em uma pequena faixa. O principal motivo 
disso é que os sistemas sensores são concebidos para registrar toda uma gama 
possível de valores de reflectância, originada por todos os tipos de materiais 
naturais e sob as mais diversas condições de iluminação. Desse modo, o ideal é 
que objetos cinza escuros não apareçam totalmente pretos e objetos claros não 
desapareçam devido à saturação do sensor. Por outro lado, dificilmente um local 
da superfície da Terra apresenta esses dois extremos ao mesmo tempo e, por 
esse motivo, a distribuição de DNs de quase todas as imagens fica comprimida 
em uma porção relativamente reduzida do intervalo 0-255. Outras causas para o 
baixo contraste das imagens de satélite incluem a presença de bruma 
atmosférica, má iluminação solar da cena, performance deficiente do sensor e as 
próprias características da cena. 

Uma vez que o sistema visual humano só consegue discriminar cerca de 
30 tons de cinza, e assim mesmo só quando eles são bastante espalhados entre 
o preto e o branco (representados digitalmente pelo O e pelo 255, 
respectivamente), uma imagem de satélite vista da forma como é adquirida pelo 
sensor aparece visualmente com baixo contraste. Para que as informações nela 
contidas possam ser extraídas por um analista humano, o seu histograma 
comprimido tem então que ser expandido para ocupar todo o intervalo disponível. 
Esse conceito é a base do chamado aumento de contraste ("contrast stretch"em 
inglês). 

O aumento de contraste é provavelmente uma das mais poderosas, 
importantes e sem dúvida a mais usada das técnicas de processamento para 
extração de informações de imagens de sensoriamento remoto. Apesar disso, ele 
é muitas vezes considerado (erroneamente) como um processo simples e 
aplicado usando-se "receitas" contidas no software de sistemas de 
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processamento de imagens. Por outro lado, deve-se enfatizar que o aumento de 
contraste não irá nunca revelar informação nova, que não esteja já contida na 
imagem original. A função dele é apenas apresentar a mesma informação contida 
nos dados brutos, porém de uma forma mais claramente visível ao intérprete. 
Outro ponto importante é que deve-se ter bem claros os motivos pelos quais vai- 
se aplicar o aumento de contraste em uma imagem, antes mesmo de fazê-lo, uma 
vez que esse processamento pode afetar o resultado de operações 
subsequentes. Ao se usar essa técnica em um estágio de pré-processamento, 
deve-se atentar para o fato de que parte da informação pode ser perdida, 
dependendo da forma como é feito o aumento de contraste! 

O contraste de uma imagem é uma medida do espalhamento dos 
níveis de intensidade que nela ocorrem (Figura 4.1). Esse conceito é facilmente 
entendido ao se examinar o histograma de uma imagem: quanto mais espalhado 
for ele, maior o contraste da imagem e vice-versa. Deve ser lembrado que, em 
qualquer sistema sensor, esse intervalo de espalhamento é sempre positivo e 
limitado por um mínimo e por um máximo, sendo mais usual o intervalo de 0 a 256 
níveis de cinza. 


Figura 4.1 - A imagem cujo histograma está representada em A) possui 
menos contraste do que a imagem do histograma B), pois o espalhamento 
deste último é maior do que o primeiro. 


Uma das aplicações mais comuns do aumento de contraste é na 
preparação de composições coloridas usando 3 bandas de um sensor. Para que 
seja obtida uma boa distribuição de cores nesse tipo de composição, é necessário 
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que as 3 bandas tenham primeiramente os seus contrastes aumentados. Desse 
modo, obtém-se uma maior variação de matizes nas 3 cores básicas (vermelho, 
azul e verde) às quais serão atribuídas as 3 bandas. 


4.2 A função de transferência de contraste 


Quando o contraste de uma imagem é modificado, o histograma da imagem 
resultante é diferente da imagem original, sendo a relação entre os dois 
histogramas especificado pela função de transferência de contraste. Essa 
função é em geral uma curva plotada em relação a dois eixos (X e Y) 
representando as intensidades da imagem original e modificada. A função de 
transferência especifica a transformação de contraste e é aplicada na imagem da 
seguinte maneira: para se achar a intensidade transformada de um pixel da 
imagem, toma-se a intensidade original desse mesmo pixel, plotando-a no eixo 
X. Em seguida traça-se uma linha vertical a partir daquele ponto até encontrar-se 
a curva da função de transferência. A intensidade transformada do pixel é 
determinada traçando-se uma linha horizontal a partir dessa intersecção, até o 
eixo Y. A ação da função de transferência de contraste não depende das 
intensidades dos pixels ao redor do pixel considerando, isto é, ela é uma 
operação pontual. 

Uma função de transferência pode ter qualquer formato, sempre 
obedecendo algumas limitações. Um vez que as intensidades de ambas, as 
imagens original e final, são limitadas a um determinado intervalo a curva é 
limitada à área definida pelos eixos X e Y (cada um variando geralmente de 0 a 
255). Considerando-se um pequeno intervalo de valores de intensidade na 
imagem original, esse intervalo é modificado para um novo intervalo de 
intensidades na imagem final, o qual vai depender da altura da função de 
transferência sobre o eixo X. Esse intervalo será expandido ou comprimido de 
acordo com a inclinação da função de transferência. Se a inclinação for maior do 
que 45º o contraste será expandido; se for menor do que 45º o contraste será 
comprimido. Deve ser lembrado que a função de transferência no caso de dados 
digitais não é contínua, mas sim formada por uma série de degraus, devido à 
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própria natureza discreta dos dados digitais. 


Rs 


E | S 


Figura 4.2 - Uma imagem tendo o histograma mostrado no eixo X, quando 
submetida à função transferência de contraste representada pelos dois 
segmentos de reta do gráfico acima, irá produzir uma imagem cujo histograma 
está plotado ao longo do eixo Y do gráfico. Pixels com DN igual à N na 
imagem original vão ter seu novo nível de cinza igual à N' na imagem 
transformada. Notar que, quando a curva de transferência de contraste possui 
uma inclinação maior do que 45° o contraste é expandido, ao passo que 
quando a inclinação é menor do que 45°, ele é comprimido. 


A forma como os sistemas de processamento digital de imagens 
implementam a função de transferência chama-se "Look-up Table (LUT)". Através 
desse artifício, evita-se especificar a função de transferência matematicamente 
e aplicá-la a cada um dos pixels da imagem para calcular as novas intensidades, 
o que seria extremamente vagaroso. O fundamento desse processo é o seguinte: 
uma imagem digital de 8 bits contém apenas 256 valores possíveis de intensidade 
e pode-se então fazer o cálculo apenas uma vez para cada um desse valores, 
antes de se modificar a imagem, armazenando os resultados numa tabela. Essa 
tabela vai conter a função de transferência. Para aumentar o contraste da 
imagem, toma-se cada intensidade de pixel da imagem de entrada, usando-a 
como um "endereço" para procurar ("look-up" em inglês) na LUT o valor 
correspondente para a imagem de saída. Esse processo é geralmente 
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implementado através de "hardware", é extremamente rápido e dispensa cálculos 
complexos, uma vez que somente 256 cálculos são realizados, no lugar dos 
1.048.576 necessários para uma imagem de 1.024 por 1.024 pixels. 


4.3 Aumento linear de contraste 


A forma mais simples de se aumentar o contraste de uma imagem é 
através do aumento linear de contraste (ALC). Nele, a função de transferência 
é uma reta e apenas 2 parâmetros são controlados: a inclinação da reta e o ponto 
de intersecção com o eixo X (Figura 4.3). A inclinação controla a quantidade de 
aumento de contraste e o ponto de intersecção com o eixo X controla a 
intensidade média da imagem final. 

A principal característica do ALC é que as barras verticais que formam o 
histograma da imagem de saída são espaçadas igualmente, uma vez que a 
função de transferência é uma reta. Além disso, o histograma final será idêntico 
em formato ao histograma inicial, exceto que ele terá um valor médio e um 
espalhamento diferentes. 

O ALC pode, dependendo do software usado, ser implementado de forma 
interativa. Nesta, a inclinação e o ponto de intersecção são controlados pelo 
usuário, através de um "mouse", tablete gráfico ou "trackball" e o usuário pode 
acompanhar o resultado da operação visualmente, através do monitor de vídeo, 
na própria imagem de saída. 
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Figura 4.3 - Histograma de uma imagem e de sua versão com aumento linear de contraste 
(ALC), aplicado segundo a função de transferência linear acima. Notar que o espaçamento entre 
as populações se mantiveram constantes e que a forma do histograma não se alterou. 


É importante notar o que ocorre ao se aumentar a inclinação da reta de 
transferência: a inclinação controla a quantidade de expansão das intensidades 
da imagem original e uma inclinação exagerada pode fazer com que as 
intensidades na imagem contrastada excedam os limites permitidos. Isso deve ser 
evitado a todo custo pois, uma vez que as intensidades atinjam o limite, ocorre um 
"overflow" e as colunas correspondentes do histograma são "presas" no valor 
preto ou branco (dependendo de qual extremidade ocorreu o "overflow". Isso 
representa uma perda de informação, uma vez que pixels de colunas vizinhas do 
histograma, que originalmente podiam ser diferenciados com base no seu DN, 
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serão fundidos numa só coluna e passarão a ter o mesmo DN (0 ou 255), 
conforme mostrado na Figura 4.4. 


Figura 4.4 - Um aumento exagerado de contraste pode causar perda de informação na 
imagem resultante, conforme mostrado acima. As duas extremidades do histograma da 
imagem contrastada (0 e 255) mostram populações altas, o que não ocorria na imagem 
original. Isso denota a ocorrência de "overflow", o que modifica a forma do histograma 
original. 

No caso de um aumento excessivo de contraste linear, a forma do 
histograma será modificada em relação à imagem original, conjuntos de pixels 
passarão a ocupar valores incorretos de cinza e o processo é irreversível: não há 
nenhuma maneira de redistribuir os pixels de uma coluna do histograma em duas 
ou mais colunas após ter ocorrido o "overflow". A informação que é "prêsa” nesse 
processo é permanentemente perdida. Por outro lado, pode-se desejar que isso 


ocorra, de forma não intensa e controlada, nos casos em que interessa expandir 
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bastante apenas um pequeno intervalo de intensidades. Deve ficar claro, porém, 
que isso pode afetar seriamente qualquer outro tipo de processamento 
subsequente. Como regra geral, pode-se dizer que o ALC deve ser aplicado de 
preferência após outros tipos de processamento, no sentido de produzir uma 
melhor distribuição de intensidades, apenas para a visualização ou impressão do 
produto final. 


4.4 Aumento bilinear de contraste 


Existem situações em que a informação que se deseja realçar por aumento 
de contraste não está contida em apenas uma região do histograma. Para melhor 
se entender isso, tomemos um exemplo: para uma determinada aplicação, 
necessita-se aumentar o contraste de dois intervalos de DNs, um localizado na 
parte mais escura, digamos no intervalo 0-100, e a outra localizada no intervalo 
mais claro, digamos 101-255. Existe uma maneira de se aplicar aumento linear 
de contraste apenas nesses dois intervalos, deixando o restante dos DNs 
originais sem contraste. A forma de se fazer isso é através do aumento bilinear 
de contraste (ou mesmo multi-linear), em que uma alta inclinação é atribuída a 
pequenos segmentos de reta da curva de transferência (Figura 4.5). O aumento 
bilinear de contraste é bastante poderoso, mas requer muito cuidado e uma boa 
dose de reflexão anterior à sua aplicação, para que sejam definidas 
cuidadosamente as regiões em que se quer realçar o contraste. Muitos sistemas 
de processamento de imagens permitem que ele seja aplicado interativamente, 
escolhendo-se graficamente os segmentos da função de transferência e 
observando-se os resultados simultaneamente. 
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Figura 4.5 - Aumento bilinear de contraste, onde os intervalos de níveis de cinza 
entre 50-100 e 200-250 possuem seus contrastes aumentados linearmente, 
enquanto que os demais níveis de cinza são comprimidos. 


Uma das aplicações mais comuns do aumento bilinear de contraste é para 
produzir uma imagem com histograma aproximadamente simétrico, a partir de um 
histograma assimétrico. Neste caso, especifica-se uma média para a distribuição 
e segmentos de inclinação diferente na função de transferência para os dois 
lados do histograma, sendo maior a inclinação quanto menos espalhado for o 
histograma, conforme mostrado na Figura 4.6. 
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Figura 4.6 - O aumento bilinear de contraste é usado neste caso para remover a 
assimetria da distribuição de níveis de cinza da imagem original, produzindo uma 
imagem com um histograma simétrico. 


Da mesma forma como um aumento de contraste pode ser definido por 
dois segmentos de reta, ele pode da mesma forma ter uma função de 
transferência definida por vários segmentos de reta. Neste caso, eles são 
chamados de aumentos multi-lineares de contraste, embora seu uso não seja 
comum, requerendo uma definição cuidadosa dos intervalos a serem realçados 
e das inclinações dos vários segmentos, feita de preferência interativamente. 


4.5 Aumentos não-lineares de contraste 


O ALC possui a vantagem de ser simples de se especificar e calcular, além 
de apresentar resultados que são de fácil compreensão e interpretação. Todavia, 
existem situações em que o ALC não consegue revelar tipos específicos de 
informação em uma imagem. Para esses casos, existem inúmeros tipos de 
funções de transferência não-lineares e trataremos aqui de algumas mais 
comuns. 
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A equalização de histograma (ou achatamento) parte do princípio que 
o contraste de uma imagem seria otimizado se todos os 256 possíveis níveis de 
intensidade fossem igualmente utilizados ou, em outras palavras, todas as barras 
verticais que compõem o histograma fossem da mesma altura. Obviamente isso 
não é possível devido à natureza discreta dos dados digitais de uma imagem de 
sensoriamento remoto. Contudo, uma aproximação pode ser conseguida ao se 
espalhar os picos do histograma da imagem, deixando intocadas as partes mais 
"chatas" do mesmo. Esse processo é obtido através de uma função de 
transferência que tenha uma alta inclinação toda vez que o histograma original 
apresentar um pico e uma baixa inclinação no restante do histograma, conforme 
mostrado na Figura 4.7. Uma vez que um pico alto requer mais espalhamento do 
que um pico mais baixo, isso implica que a inclinação da curva deverá ser 
proporcional à altura do pico do histograma. O histograma cumulativo neste caso 
vai tender a se aproximar de uma reta ascendente (motivo pelo qual ele é 
chamado em inglês de "ramp stretch”. A utilidade de um aumento de contraste 
tipo equalização é que imagens com extensas áreas de intensidade uniforme, as 
quais produzirão histogramas com um largo pico central, serão bastante 
realçadas, com a possibilidade de que sejam revelados detalhes de contraste 
previamente não perceptíveis. Por outro lado, a informação representada por 
pixels com intensidade localizada nas extremidades do histograma será bastante 
comprimida em termos de contraste e, consequentemente, prejudicada. 

A normalização de histograma (ou aumento Gaussiano de contraste) 
obedece às leis Gaussianas de distribuição estatística, produzindo um histograma 
em que a média e o desvio padrão da distribuição são especificados e que possui 
a forma aproximada de um sino (Figura 4.8). A sua vantagem é que a informação 
contida nas extremidades do histograma é realçada. Ao se produzir composições 
coloridas de 3 bandas, o uso da normalização é desejável pois as 3 bandas 
poderão ter seus histogramas com a mesma média e desvio-padrão, obtendo-se 
assim um balanceamento de cores na composição. 
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Figura 4.7 - Aumento de contraste por equalização de histograma. Deve ser 
notado que a curva de transferência é tanto mais inclinada quanto maior for 
a população de um determinado nível de cinza. 


Figura 4.8 


Aumento Gaussiano de contraste, com a média igual a 128. Cerca de 67% dos pixels 
estão incluídos no intervalo de 1 desvio-padrão (0) em torno da média. 
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Quando se deseja realçar a informação contida na porção mais escura de 
uma imagem, a qual apresenta também porções claras, o uso de um aumento 
logarítmico de contraste é indicado. Neste caso, a curva de transferência é uma 
função logarítmica, com uma inclinação maior na porção relativa às baixas 
intensidades, a qual vai progressivamente tendendo à horizontal nas intensidades 
mais elevadas (Figura 4.9). De modo inverso, quando se tem uma imagem com 
porções claras e escuras na qual se quer realçar as porções mais claras, usa-se 
um aumento exponencial de contraste, cuja curva de transferência é uma 
função exponencial, conforme ilustrado na Figura 4.10. 


À iza 


Figura 4.9 - Aumento logarítmico de contraste, que permite realçar os tons mais escuros de cinza 
de uma imagem, às custas dos tons mais claros, os quais serão comprimidos. 


51 


Baixado por Daiane Cardoso Lopes (daiane.lopes(seducam.pro.br) 


A. P. Crósta, Processamento Digital de Imagens de Sensoriamento Remoto 1992 


RITA 


Figura 4.10 - Aumento exponencial de contraste, utilizado para realçar os tons mais claros de 
uma imagem, às custas dos tons mais escuros, os quais sofrerão uma compressão no contraste. 


4.6 Aumento "quase-linear" de contraste 


Existem vantagens e desvantagens em ambos os tipos de técnicas de 
aumento de contraste, lineares e não-lineares. Como já mencionado, as técnicas 
lineares são mais simples, fáceis de implementar e de interpretar; por outro lado, 
elas não são capazes de lidar eficientemente com distribuições de DNs mais 
complexas. As técnicas não-lineares possuem essa capacidade, mas oferecem 
uma maior complexidade de implementação e de interpretação dos seus 
resultados; além disso, elas afetam intensamente a forma original do histograma 
de uma imagem, causando uma consequente mudança na estrutura de 
informação da imagem e, por vezes, uma perda parcial de informação. 

Uma maneira intermediária de buscar as vantagens de ambos os tipos, 
sem contudo ter que incorrer nas desvantagens, é oferecida por um tipo de 


z 


aumento "quase-linear" de contraste. Este é chamado "Balance Constrast 
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Enhancement” (Realce de Contraste Balanceado) e é implementado 
matematicamente através de uma função parabólica ou cúbica, no sentido de 
obter uma curva de transferência de contraste que se aproxima de uma reta, 
embora não o seja. Essa técnica permite que o usuário tenha um total controle 
sobre os 5 parâmetros que controlam o processo de aumento de contraste: DN 
mínimo e máximo, média e valores máximo e mínimo de corte. Por outro lado, ela 
preserva formato original do histograma, evitando portanto perda de informação. 
Seu uso principal é para produzir imagens com o contraste balanceado, para 
posterior combinação de tripletes a cores, evitando qualquer tendenciosidade na 
distribuição de cores. É necessário porém que o "software" de processamento 
utilizado tenha essa função em sua biblioteca, o que não é o caso de nenhum dos 
atualmente existentes. 


4.7 Conclusões 


Procurou-se nesta seção esboçar os conceitos básicos e processos 
relativos ao aumento de contraste de imagens digitais. A base conceitual reside 
na relação entre o contraste de uma imagem e o seu histograma de intensidades, 
bem como no entendimento da função de transferência de contraste. 

Do ponto de vista do usuário, é importante saber que existe uma variedade 
de tipos de aumento de contraste e que cada um deles se aplica de forma mais 
eficaz a determinadas situações. Na imensa maioria das vezes, o uso de um 
aumento linear de contraste bem dimensionado resolverá a questão e produzirá 
uma imagem com boas característica visuais de interpretação. Por outro lado, 
para algumas situações não-convencionais, e que por vezes são mais comuns do 
que se pensa em sensoriamento remoto, é indispensável que o usuário pense 
cuidadosamente sobre qual o tipo de técnica de aumento de contraste terá melhor 
possibilidade de sucesso na solução de seu problema. 
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5.1 Introdução 


A capacidade do sistema visual humano em discernir tonalidades de cinza não 
vai além de 30 diferentes níveis. Quando se trata porém de discernir cores, esse 
número pula facilmente para algumas dezenas de milhares de cores diferentes (com 
um máximo supostamente em torno de 7 milhões). Pode-se portanto dizer que a cor 
domina o sistema visual humano. 

Em processamento digital de imagens de sensoriamento remoto, as quais por 
sua natureza multi-espectral são compostas por diversas bandas, composições a cores 
de conjuntos de três bandas (tripletes) constituem-se numa poderosa forma de 
sintetizar, numa única imagem, uma grande quantidade de informação, ao mesmo 
tempo em que representam essa informação em diferentes cores, facilitando portanto 
sua interpretação. As composições coloridas são por isso um dos produtos mais 
comuns do processamento digital de imagens de S.R.. Para se fazer um uso mais 
otimizado dessa ferramenta, é necessário entender um pouco dos fundamentos 
básicos da Teoria de Cores e algum de seus modelos, tratados a seguir. 

Antes de apresentar esses fundamentos básicos, alguns aspectos sobre 
percepção em imagens devem ser considerados. Um intérprete experiente de imagens 
de S.R. utiliza-se geralmente de três propriedades básicas das superfícies 
representadas nas imagens, para interpretá-las. São elas: tonalidade, textura e 
contexto. Tonalidade refere-se então à cor ou ao brilho dos objetos que compõem a 
cena; os tons estão relacionados às propriedades de reflectância dos materiais 
superficiais e depende da porção do espectro eletromagnético coberto pela(s) 
imagem(ns) considerada(s). Textura pode ser definida como uma combinação da 
magnitude e frequência da variação tonal em uma imagem, sendo produzida pelo 
efeito conjunto de todos as pequenas feições que compõem uma área em particular 
na imagem. Embora possam ser consideradas como propriedades independentes, 
tonalidade e textura na realidade possuem relações íntimas: sem variações em 
tonalidade, nenhuma mudança em textura poderia ser percebida. Contexto, por sua 
vez, se refere à como detalhes de tons, texturas e padrões (que são arranjos de tons 
e texturas) estão localizados em relação a atributos conhecidos do terreno; por 
exemplo, um vale em forma de "U" no deserto do Sahara provavelmente não foi 
formado por erosão glacial, mas sim como produto de erosão fluvial durante 
inundações súbitas. 

Desse modo, atributos de textura são facilmente interpretados tanto em imagens 
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coloridas como em imagens monocromáticas. Por outro lado, é necessário ter cuidado 
ao se manipular as cores em imagens de S.R., pois um exagero das mesmas pode 
introduzir certa confusão visual ao intérprete e, consequentemente, prejudicar a 
percepção das mudanças texturais, que muitas vezes contém precisamente a 
informação desejada. A decisão a ser tomada antes de se fazer uma composição 
colorida baseia-se portanto na seguinte reflexão: a informação desejada é melhor 
expressa em cores, ou uma simples imagem monocromática bastaria? 

Neste capítulo trataremos as imagens coloridas e de como elas podem ser 
realçadas para melhor visualização. Realce de informações texturais será o tema da 
próximo capítulo. 


5.2 A Teoria Básica das Cores: o Espaço RGB 


Otrabalho de Thomas Young (1773-1829) revelou os princípios da teoria básica 
das cores. Ele descobriu que, projetando luz através de filtros vermelho, azul e verde 
no sentido de produzir círculos superpostos, diversos efeitos eram obtidos. 
Primeiramente, onde os três círculos coincidiam, luz branca era produzida. Uma vez 
que já se sabia nessa época que a luz branca era composta por um espectro contínuo 
de cores, esse fato era inesperado. Segundo, onde qualquer duas cores coincidiam, 
outras cores eram produzidas. Por exemplo, vermelho e azul produziam magenta e 
vermelho e verde produziam amarelo. Young também descobriu que, variando a 
quantidade relativa de vermelho, azul e verde na área de superposição, era possível 
produzir uma enorme gama de cores, incluindo diversos tons para cada uma. Outra 
observação de Young é que qualquer uma dessas 3 cores, vermelho, verde ou azul 
(RGB), não podiam ser produzidas com mistura de duas delas. Por isso, ele as 
chamou de cores primárias aditivas, uma vez seus efeitos resultavam da adição. 

Um efeito complementar era obtido por Young ao subtrair vermelho, verde e 
azul da luz branca, usando filtros. A subtração de vermelho, por exemplo, produzia 
cyan, a de verde produzia magenta e a de azul produzia amarelo. Essas outras cores 
juntas, cyan, magenta e amarelo, por sua vez produziam preto. Magenta mais amarelo 
produzia vermelho, cyan e magenta produzia azul, amarelo e cyan produzia verde. Por 
isso, Young denominou essas três cores de cores primárias subtrativas. 

Usando-se então as cores primárias ou secundárias, é possível se obter todas 
as tonalidades de cores. Os monitores de televisão, por exemplo, fazem uso das cores 


61 


Baixado por Daiane Cardoso Lopes (daiane.lopes(Oseducam.pro.br) 


A. P. Crósia, Processamento Digital de Imagens de Sensoriamento Remoto 1992 


primárias aditivas, ao passo que os processos de impressão litográfica colorida fazem 
uso das cores primárias subtrativas. 

Usando esses princípios das cores primárias, é possível representar 
quantitativamente qualquer cor como um grupo de três números ou coeficientes. Os 
três coeficientes de cor podem ser plotados em um conjunto de eixos tridimensionais, 
onde cada eixo representa uma cor (RGB). Os três coeficientes vão definir o quanto 
de cada cor primária será necessária para produzir qualquer tonalidade. A figura 5.1 
mostra graficamente o cubo RGB, no qual a quantidade de cada cor primária varia de 
O até um máximo. Matematicamente, uma cor qualquer C é dada por: 

C =r.R + g.G + b.B 


onde R,G,B são as três cores primárias e r,g,b são os coeficientes de mistura, 
os quais são geralmente limitados ao intervalo 0<r,g,b<1. A cor C pode ser plotada no 
espaço de cores RGB usando-se os coeficientes de mistura (r,g,b) como coordenadas. 


VERDE 


amarelo 


cyan 


VERMELHO 


azul 


magenta 


AZUL 


Figura 5.1 - Cubo RGB - os diferentes tons de cinza localizam-se ao longo da diagonal 
tracejada. 
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Os eixos do espaço de cores RGB são linhas de cores primárias puras, que 
aumentam em intensidade com a distância da origem. Notar que a origem representa 
a cor preta, estando o valor máximo desse sistema (representando portanto o branco), 
situado na sua diagonal. Se quantidades iguais das primárias são misturadas (r=9g=b), 
diferentes tonalidades de cinza serão produzidas, cuja intensidade vai variar do preto 
ao branco. Portanto, a diagonal tracejada da Figura 5.1 representa o chamado eixo 
cinza (também chamado de eixo acromático), que é a linha onde os valores de r,g,b 
são proporcionalmente iguais. Nos três planos em que uma das cores primárias é igual 
a O, estão representadas todas as cores que podem ser obtidas ao se misturar apenas 
duas primárias e, particularmente, as cores formadas por quantidades iguais delas 
(cyan, magenta e amarelo). 


5.3 As cores e o sistema visual humano 


Os monitores dos sistemas de processamento de imagens são, em muitos 
casos, capazes de representar cada uma das cores básicas com 256 tonalidades de 
cores, o que dá um total de mais de 16 milhões de tonalidades. Como já foi visto, o 
sistema visual não consegue ir além de alguns poucos milhões. Uma questão que se 
coloca então é: o quanto uma cor precisa mudar para que um intérprete perceba”? Ou 
então: existem cores que são mais "visíveis" do que outras? As respostas a essas 
questões podem fornecer importantes "dicas" para se preparar composições coloridas 
de imagens de satélite. 

O diagrama de cromaticidade define o espaço de cores de acordo com o 
comprimento de onda das cores primárias puras. Esse diagrama, mostrado na Figura 
5.2, pode ser usado para plotar a sensitividade do sistema visual a mudanças de 
cores. Ele foi elaborado a partir de experimentos com indivíduos e as áreas ovais 
representam áreas de "mesma cor" para o sistema visual. Quanto maior a área, menor 
a sensitividade visual naquele determinado comprimento de onda. Observando-se 
esse diagrama, fica patente que a discriminação de cores não é constante para todas 
as cores, variando de acordo com a cor observada. Assim, sabe-se que olho diferencia 
com precisão mudanças emtons azuis, diferencia menos as mudanças emtonalidades 
vermelhas e amarelas e de forma bem mais restrita com relação a tonalidades azuis- 
avermelhadas e azuis-esverdeadas. A experiência mostra ainda que o olho é mais 
sensível a variações em intensidade do que a variações em cores. 
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5.4 Composições coloridas 


Todo mundo que já viu uma imagem de satélite colorida provavelmente já ouviu 
o termo composição colorida falsa-cor. Essa é a mais tradicional forma de se 
combinar 3 bandas espectrais de satélite para a formação de uma composição colorida 
e sem dúvida a mais usada. Para produzi-la, usando-se os sensores do satélite 
LANDSAT, são usadas as combinações MSS bandas 7, 5 e 4e TM 4, 3 e 2 em RGB, 
respectivamente. A origem dessa combinação vem da época da 2º Guerra Mundial, 
quando foi desenvolvido o filme colorido infra-vermelho para separar camuflagem da 
vegetação verdadeira. Como esse filme possui resposta espectral semelhante a essas 
combinações MSS e TM, as cores resultantes são similares. As combinações de 
bandas acima (MSS 7,5,4 e TM 4,3,2 em RGB) produzem imagens cujas cores 
coincidem com uma experiência já adquirida por fotointérpretes, onde a vegetação de 
cor verde reflete intensamente a energia eletromagnética no comprimento de onda 
relativo ao infra-vermelho, aparecendo portanto em cores vermelhas. Em relação ao 
TM, que possui bandas espectrais coincidentes com os comprimentos de onda da 
radiação visível, ao contrário do MSS, a combinação das bandas TM 3,2,1 em RGB é 
bastante utilizada, sendo portanto equivalente a uma composição colorida real, pois 
equivale às cores percebidas pelo ser humano. 
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Figura 5.2 - Sensitividade visual à mudanças de cores. Áreas ovais 
representam áreas de "mesma cor" para o olho. Quanto menor a área, maior 
a sensitividade para a cor respectiva. 


Na realidade, pode-se usar quaisquer três bandas para se produzir uma 
composição colorida. Contudo, uma cuidadosa seleção das mesmas faz-se necessária, 
para que a combinação de 3 bandas contenha a informação espectral realmente 
desejada. Isso obviamente se complica conforme aumenta o número de bandas, o que 
é uma tendência sempre crescente em sensores remotos. Em seguida, deve ser 
buscada uma alocação de cores que traduza para o olho humano essa informação da 
melhor forma possível. Embora a informação contida em um determinado triplete de 
bandas seja sempre a mesma, independentemente da alocação de cores, a diferença 
em percepção do nosso sistema visual faz com que diferentes combinações coloridas 
das mesmas 3 bandas pareçam na prática conter diferentes informações. Por isso, a 
seleção das bandas para compor uma composição colorida, assim como a alocação 
de cores, não são questões triviais e merecem a devida atenção, uma vez que pode-se 
desperdiçar informação. 

Um ponto importante nessa questão: nunca se deve aceitar "receitas" de 
composições coloridas de determinadas bandas em determinadas cores. Cada 
cena de satélite possui características próprias e cada tipo de informação desejada 
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também. Por isso, deve-se procurar selecionar cuidadosamente as bandas a serem 
combinadas, com base nas características espectrais dos alvos desejados, e tentar 
diversas combinações de cores, até achar uma que mais satisfaça ao olhos. Pode-se, 
para isso, usar o diagrama da Figura 5.2, atribuindo cada cor de acordo com a 
visibilidade relativa da feição de interesse. Isso pode significar alocar a banda com 
informação textural à cor verde (pois textura geralmente é dada por variações na 
intensidade de uma imagem, sendo que o olho é muito sensível a mudanças em 
intensidade e não o é comrelação à cor verde), enquanto as bandas contendo feições 
espectrais mais sutis seriam alocadas às cores azul e vermelho (para as quais o 
olho é mais sensível). Desse modo, a heterogeneidade da percepção visual seria 
compensada em parte, tornando a composição colorida mais eficaz. 


5.5 Aumento de contraste em composições coloridas 


Como foi visto anteriormente, as imagens de satélite são adquiridas com um 
contraste original relativamente baixo. Ao serem combinadas a cores, em tripletes, 
esse baixo contraste vai ser expresso também na distribuição de cores, no sentido de 
que somente um pequeno intervalo de cores, dentre todas as possíveis, será utilizado. 
Do ponto de vista gráfico, tomando-se o cubo RGB da Figura 5.1, seria o equivalente 
a dizer que apenas um pequeno "sub-cubo" de coordenadas r',g',b' estaria sendo 
utilizado. Essa restrição traz problemas na interpretação da imagem, uma vez que o 
sistema visual não consegue discriminar cores dentro de um pequeno intervalo. Para 
o intérprete, o colorido de uma imagem sem contraste aparecerá "desbotado". Porisso, 
o aumento de contraste é essencial na produção de composições coloridas e todas as 
técnicas de aumento de contraste discutidas anteriormente podem ser aplicadas, 
considerando-se a adequação de cada uma delas a situações específicas. 

Dois pontos importantes quando se fala em aumento de contraste para 
composição a cores. Primeiramente, deve-se notar que alguns tipos mais "exóticos" 
de funções de transferência podem produzir alguns "buracos" na distribuição de 
intensidades de uma imagem (dada a natureza discreta das imagens digitais). Esses 
"buracos", por sua vez, vão se traduzir na supressão de tonalidades na composição 
colorida final, sendo portanto indesejáveis. Em segundo lugar, deve ser enfatizado que 
o olho capta mais precisamente mudanças em intensidade do que mudanças em cor, 
de tal forma que um excessivo aumento de contraste numa composição colorida vai 
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eventualmente produzir uma imagem com uma certa "sobrecarga" visual, que no lugar 
de auxiliar, pode na verdade confundir o intérprete. 


5.6 A correlação espectral e suas consequencias na composição colorida 


Imagens produzidas por sensores multi-espectrais sofrem intrinsecamente de 
uma limitação: como muitas vezes as diversas bandas espectrais (ou intervalos de 
comprimento de onda) que compõem a imagem são contíguas, há uma grande 
repetição da informação espectral de uma banda para outra. Exemplificando: a sombra 
topográfica criada pela projeção dos raios solares oblíquos ao terreno imageado 
sempre aparecerá escura numa imagem de satélite, independente da banda 
considerada; portanto, os pixels relativos a essas zonas sombreadas terão um baixo 
DN em todas as bandas, sendo então ditos correlacionados do ponto de vista 
espectral. Considerando o cubo RGB, o que acontece ao se combinar três imagens 
com alta correlação para criar uma composição colorida é que a distribuição das 
intensidades vai se dar ao longo do eixo cinza ou acromático. Isso significa que, por 
mais que se tente aumentar o contraste de 3 bandas correlacionadas entre si, nunca 
vai se conseguir uma boa distribuição de cores na composição colorida. 

A Figura 5.3a mostra o histograma tri-dimensional de 3 bandas correlacionadas, 
cuja distribuição de intensidades se dá ao longo do eixo acromático; ao se aumentar 
o contraste das 3 bandas, consegue-se apenas esticar o elipsóide ao longo do eixo 
acromático, aumentando a intensidade da distribuição de cores sem contudo fazer uso 
do espaço de cores disponíveis. 

Existem maneiras de remover essa correlação inter-bandas antes de combiná- 
las a cores e, desse modo, utilizar melhor o espaço de cores, produzindo imagens com 
grande variação de tonalidades. As técnicas mais comuns de remoção da correlação 
são a Transformação HSle o Realce por Decorrelação. A primeira dessas técnicas 
será tratada a seguir, ao passo que a segunda será vista quando for abordada a 
Análise por Principais Componentes. 


5.7 Transformação HSI 


O espaço de cores conhecido por HSI (Hue, Saturation, Intensity) é uma forma 
alternativa ao espaço RGB de representação de cores. No espaço HSI, as cores são 
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definidas por três atributos, ao invés de três quantidades de cores primárias. Esses 
atributos são: Intensidade (Intensity-l), Matiz (Hue-H), Saturação (Saturation-S). 


Eixo 
Acromatico 


Regiao nao 
utilizada 


Figura 5.3 - A - A correlação entre as bandas faz com que o histograma tridimensional 
de uma composição colorida tenha a forma alongada, geralmente centrada ao longo 
do eixo acromático. 

B - O aumento de contraste aplicado às três bandas expande a distribuição original, 
mas não elimina a correlação; as regiões não utilizadas do espaço de cores 
permanecem. 
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Esses atributos podem ser analisados e manipulados individualmente, ao 
contrário do sistema RGB, onde eles são intrinsecamente interligados. Eles descrevem 
a formação de cores de uma maneira muito mais próxima àquela pela qual o sistema 
visual humano as percebe e, devido a isso, o sistema HSI apresenta vantagens nítidas 
em relação ao sistema RGB. Matiz de um objeto é a medida do comprimento de onda 
médio da luz que ele reflete ou emite, definindo portanto a cor do objeto. Intensidade 
é a medida da energia total envolvida em todos os comprimentos de onda, sendo 
portanto responsável pela sensação de brilho dessa energia incidente sobre o olho. 
Saturação, ou pureza, expressa o intervalo de comprimentos de onda ao redor do 
comprimento de onda médio no qual a energia é refletida ou transmitida; um alto valor 
de saturação resulta em uma cor espectralmente pura, ao passo que um baixo valor 
indica uma mistura de comprimentos de onda, que irá produzir tons-pastel (apagados). 
O espaço IHS pode ser graficamente representado como um cone. A relação espacial 
entre o espaço RGB e o IHS é mostrada na Figura 5.4. 

O sistema HSl utiliza coordenadas cilíndricas polares para representar as cores, 
ao invés de coordenadas cartesianas como o sistema RGB. A distância de um ponto 
até a origem ou ápice do cone representa a intensidade ou brilho. A distância radial 
do ponto até o eixo central do cone representa a saturação da cor. O matiz é 
representado como uma sequência radial ao redor dos círculos de saturação e do eixo 
de intensidade; embora o matiz varie na prática de O a 255, devido às características 
das imagens digitais, seu valor representa na verdade um ângulo que varia de 0 a 
360º, sendo que 0º significa a cor verde (DN=0), 120º representa o vermelho (DN=85), 
240º é a cor azul (DN=170) e 360º é o verde novamente (DN=255). Por serem 
independentes, esses três parâmetros podem ser analisados e modificados 
separadamente, para melhor se ajustar as cores às características do sistema visual. 

O sistema HSI é usado no processamento de imagens de satélite através de um 
processo de múltiplas etapas, esquematizado na Figura 5.5. Primeiramente, três 
bandas contendo as informações espectrais de interesse são selecionadas, fazendo- 
se então os cálculos do matiz, saturação e intensidade para esse triplete; esses 
cálculos são feitos através de algoritmos matemáticos que relacionam os dois espaços 
de cores. Esse processo produz três novas imagens (H', S', |) representando 
respectivamente a intensidade, a saturação e o matiz do triplete original. Em seguida, 
aplica-se um aumento linear de contraste (ALC), para expandir o intervalo de 
intensidade e de saturação, de forma idêntica ao processo comumente aplicado para 
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aumentar o contraste de uma imagem qualquer, produzindo as imagens contrastadas 
H", S", I". A última etapa do processo envolve uma reversão dessas tres imagens para 
as coordenadas RGB (produzindo as imagens R", G", B"), uma vez que os monitores 
de vídeo dos sistemas de processamento de imagens trabalham somente nesse 
sistema. Da mesma forma que a transformação RGB->IHS, a transformação inversa 
é feita matematicamente. 


Seccao do 
cone HSI 


Figura 5.4 - Diagrama esquemático mostrando a relação entre os espaços HSI e 
RGB; o cone representando o espaço HSI possui uma origem comum com os eixos 
r,g,b. O ápice do cone HSI representa a cor preta, enquanto o seu eixo coincide com 
o eixo acromático. A intensidade aumenta em sentido contrário ao do ápice. Uma 
secção circular do cone mostra a variação de matizes ao redor do perímetro. A 
saturação de matizes aumenta para fora do centro, passando de cinza para tons- 
pastel e destes para matizes espectrais puros. (Modificado de Drury, 1987). 


Os usos dessa técnica em sensoriamento remoto são de dois tipos: produzir 
composições coloridas com correlação interbanda reduzida, consequentemente com 
melhor utilização do espaço de cores, e combinar diferentes tipos de imagens, ou 
mesmo imagens de natureza diferente. Exemplos desses dois últimos tipos de 
utilização são a fusão de imagens SPOT/Pan (composta por apenas uma banda) e TM 
e integração de imagens de satélite com informações geofísicas. No caso da fusão 
SPOT/TM, o procedimento envolve calcular os componentes H, Se la partir das três 
bandas selecionadas do TM, aplicar o aumento de contraste nos componentes H, S 
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e na imagem SPOT/Pan, substituir o componente | pela imagem SPOT e aplicar a 
transformação inversa HSl->RGB. Desse modo, é possível a obtenção de uma 
composição colorida com a resolução espectral correspondente às três bandas TM e 
a resolução espacial da imagem SPOT/Pan (que é de 10 metros, contra 30 metros das 
imagens TM). 


transformacao 


para 
RGB 


Figura 5.5 - Esquema da transformação RGB->HSI->RGB. Notar que após o cálculo 
das componentes HSI, elas sofrem um aumento de contraste, linear ou não. 


5.8 Pseudo-cor 


Algumas vezes, é desejável o uso de cor para realçar algum tipo de informação 
em uma imagem originalmente preto-e-branca. A técnica pela qual uma imagem 
monocromática é traduzida em cores é denominada pseudo-cor. Em processamento 
de imagens isso é feito através da transformação da escala de níveis de cinza em 
escala de cores, ou seja, atribuindo-se diferentes cores para intervalos de DNs. A 
vantagem dessa técnica é a de realçar pequenas diferenças de DNs da imagem 
monocromática; por exemplo, se atribuirmos a cor vermelha ao intervalo de 41<DN<50 
e a cor verde ao intervalo 51<DN<60 os pixels correspondentes serão facilmente 
separáveis, ao passo que na imagem monocromática isso não ocorreria. Por outro 
lado, essa técnica só funciona se houver áreas com diferentes intervalos de DNs, 
porém homogêneas internamente, pois informações de detalhes em imagens são 
geralmente perdidas devido à transformação do intervalo 0-255 para um intervalo com 
um número menor de cores. 

A técnica de pseudo-cor pode ser implementada através da manipulação das 
"look-up tables" (LUTs), como mostrado na Figura 5.6. Na parte superior da figura são 
mostradas as LUTs para a imagem monocromática, que são todas iguais, enquanto na 
parte inferior encontram-se as LUTs transformadas. Como cada uma das LUTs 
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alimenta um dos inputs de cor (R, G e B), a imagem exemplificada na Figura 5.6 vai 
ser exibida no monitor de vídeo com o intervalo de DNs de 0 a 84 em vermelho, de 85 
a 169 em verde e de 170 a 255 em azul. 


Vermelho Verde Azul 
255 
0 255 
DNs A 
| \ sã 
0 255 
DNs B 
Figura 5.6 


A - LUTs para visualização da imagem monocromática. 
B - LUTs para visualização em pseudo-cor da imagem monocromática. 


Uma outra técnica para obtenção de imagens pseudo-coloridas exige um pouco 
mais de sofisticação, sendo disponível como opção interativa e em alguns programas 
de processamento de imagens. Através dela pode-se controlar o matiz inicial (atribuído 
aos DNs mais baixos), o número de vezes em que cada uma das cores em volta do 
círculo de matizes será alocada e o número de cores usadas em cada volta no círculo. 
Por ser interativa (o usuário está observando as cores enquanto seleciona os 
parâmetros), esse método é mais eficiente e permite um total controle por parte dos 
usuários sobre o produto final. 

A pseudo-cor é bastante usada em processamento digital de imagens de S.R. 
para representar o resultado final de classificações estatísticas, em que no máximo 
poucas dezenas de classes são definidas, não havendo portanto necessidade de se 
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usar um grande número de cores. Outro uso, esse já fora do S.R., é na representação 
de modelos digitais de elevação (DEM) e também para apresentação de imagens 
representando grandezas geofísicas, geoquímicas e outras. 
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6.1 Introdução 


Em uma imagem qualquer de sensoriamento remoto, considerada em uma 
de suas bandas espectrais, observa-se que a intensidade de cinza, representada 
pelos DNs dessa imagem, varia bastante em função da distância. Ao se plotar 
essas variações em um gráfico como o da Figura 6.1, obtém-se geralmente uma 
curva complexa (Fig. 6.1a). Essa curva, por sua vez, pode ser decomposta em um 
conjunto de componentes senoidais (Fig. 6.1b), com diferentes frequências e 
amplitudes. Essas senóides fornecem uma idéia da distribuição espacial de 
frequências da imagem considerada. Nos gráficos da Figura 6.1, um caso 
hipotético é mostrado, em apenas uma dimensão, mas nas imagens de S.R. esse 
fenômeno é bidimensional. 


(a) 


Intensidade (DN) 


Distancia 


(b) 


Intensidade (DN) 


Distancia 


Figura 6.1 - As variações de DN ao longo de 
uma linha de uma imagem (a) podem ser 
expressas como várias componentes senóides 
(b), com diferentes amplitudes e frequências 
(Modif. de Drury, 1989). 
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Todas as imagens possuem limites entre áreas com diferentes respostas 
em relação à energia eletromagnética. Esses limites podem ser, por exemplo, 
entre diferentes coberturas do terreno (solo, vegetação, rocha), ou podem 
representar o contato entre áreas com diferente condições de iluminação, devido 
à sombreamento topográfico. Em uma imagem monocromática, esses limites 
representam portanto mudanças de um intervalo de DNs para outro. Ao se plotar 
esses limites em um gráfico como o da Figura 6.1, eles serão representados por 
umgradiente bastante inclinado, podendo chegar a vertical. Limites deste tipo são 
conhecidos como bordas. Eles ocupam geralmente áreas pequenas na imagem, 
sendo mais estreitos do que largos. Por variarem bastante em áreas pequenas, 
são chamados de feições de alta frequência, sendo representados na Figura 
6.1a pelas senóides de pequena amplitude. Exemplos desse tipo de feição são 
limites entre diferentes tipos de plantações, entre áreas sombreadas e iluminadas, 
redes de transporte (malha urbana, rodovias, ferrovias), redes de drenagem, 
estruturas geológicas (falhas, fraturas) e outras. 

Já limites gradacionais, que variam mais uniformemente com a distância, 
sendo consequentemente menos nítidos, são chamados de feições de baixa 
frequência. Estes são representados pelas senóides de grande amplitude na 
Figura 6.1b. Exemplos de feições de baixa frequência são dados por áreas 
monotonamente uniformes em imagens, tais como uma grande área de 
monocultura em terreno plano. 

Percebe-se portanto que a noção de alta ou baixa frequência é uma função 
da escala da imagem. Ao se diminuir a escala, a frequência de um determinado 
tipo tende a se tornar maior e vice-versa. 

Existe toda uma gama de frequências em praticamente qualquer imagem 
de S.R., das baixas, passando pelas médias e chegando até às altas frequências. 
Do ponto de vista de extração de informações a partir de imagens, as bordas 
normalmente são mais interessantes, representadas então pelas feições de alta 
frequência. Na seção anterior, foi visto que o olho humano é muito mais sensível 
a variações em intensidade do que a variações em cor. Uma outra característica 
do olho é que ele é extremamente preciso na percepção de bordas. 

A enorme mistura de frequências em uma imagem dificulta sobremaneira 
a interpretação de feições com frequências específicas. Para contornar esse 
problema e melhorar a aparência da distribuição espacial das informações, são 
utilizadas técnicas de filtragem espacial de frequências. Estas consistem em 
realçar seletivamente as feições de alta, média ou baixa frequências que 
compõem as imagens de sensoriamento remoto. 

De maneira geral, as filtragens espaciais são úteis em processamento de 
imagens de S.R. para realçar bordas, feições lineares de determinadas 
direções e padrões de textura. Isso tudo é feito através do realce ou da 
supressão de determinadas frequências espaciais. 
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Pelo exposto acima, fica claro que as bordas e essas outras feições não 
podem ser detectadas a partir da análise isolada do nível de cinza um único pixel. 
Ao contrário, pode-se dizer que a existência dessas feições é expressa pela 
diferença entre as intensidades de pixels vizinhos. Trata-se fundamentalmente 
de uma operação de área ou de vizinhança, ao contrário das operações 
pontuais como as usadas pelas técnicas de aumento de contraste vistas 
anteriormente. 

Existem duas maneiras de se implementar as técnicas de filtragem de 
frequência: o processo conhecido por convolução, que opera no domínio 
espacial de uma imagem, ou a Análise de Fourier, que opera no domínio das 
frequências que compõem a imagem. A filtragem no domínio de frequências é 
sem dúvida mais poderosa e precisa, mas é também muito mais complexa. A 
convolução, por sua vez, é mais simples e fácil de implementar, atendendo 
satisfatoriamente à grande maioria das necessidades em termos de imagens de 
S.R. A maioria dos sistemas de processamento de imagens utiliza filtragem por 
convolução e, por isso, apenas esta última será aqui abordada. 

São três os tipos básicos de filtros de convolução: filtros passa baixas, 
passa altas e direcionais. Um quarto tipo, o filtro passa banda, é geralmente 
menos utilizado em filtragem por convolução, por ser de difícil implementação, 
sendo mais comum nas filtragens executadas no domínio das frequências. 


6.2 Filtragem com a janela móvel 


Antes de abordar os tipos de filtros propriamente ditos, faz-se necessário 
entender a maneira pela qual operam os filtros de convolução em uma imagem. 
Para isso, examinemos o conceito de janela móvel ou máscara. A Figura 6.2 
mostra uma imagem de entrada A, submetida à filtragem por convolução através 
de uma janela M de dimensões 3x3 pixels, para produzir uma imagem de saída 
B. Cada cela da imagem de entrada tem o seu valor próprio de DN e as 9 celas 
da janela de filtragem possuem também seus valores pré-definidos, conforme 
será visto mais adiante nesta seção. 

A forma pela qual a janela móvel opera é a seguinte: primeiramente 
posiciona-se a janela sobre o canto superior esquerdo da imagem, multiplicando- 
se cada DN das 9 celas desta pelo respectivo valor das 9 celas da janela; em 
seguida, substitui-se o valor do pixel central dessa área da imagem (no caso, o 
pixel da 2º linha/2º coluna) pela soma desses 9 valores, encontrando-se então o 
novo valor do pixel correspondente da imagem de saída. O próximo passo é 
mover a janela um pixel ao longo da linha e fazer novamente essa mesma 
operação, encontrando-se então o valor do pixel correspondente à 2º linha/3º 
coluna da imagem de saída. Essa operação é feita portanto pixel-a-pixel para a 
imagem toda, sempre recalculando o novo valor do pixel em função dos seus 8 
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vizinhos mais próximos, no caso da janela ter uma dimensão de 3x3, ou dos seus 
24 vizinhos no caso da janela ter dimensão 5x5. 

Em filtragens digitais pode-se usar teoricamente filtros de quaisquer 
dimensões, embora os programas de processamento de imagens disponíveis 
geralmente limitem as dimensões a, no máximo, 11x11 elementos, por problemas 
computacionais. Outro ponto diz respeito à forma do filtro, que tanto pode ser 
unidimensionais, em forma de linha ou coluna, quanto bidimensionais, em forma 
de quadrado (também chamado filtro "box" ou do sinal "+" (também chamado 
de "plus-shaped"”. 


Imagem de entrada 


Janela ou mascara 


Figura 6.2 - Esquema da janela móvel para filtragem de uma imagem por convolução. 
Ae B são as imagens de entrada e saída, respectivamente, e M é a máscara ou janela, 
de dimensões 3x3 pixels. O DN do pixel central da imagem de saída é calculado 
multiplicando-se os valores X1,X2...,X9 (pêsos) da máscara pelos valores de DN dos nove 
pixels da imagem de entrada e somando-se os resultados. 


79 


Baixado por Daiane Cardoso Lopes (daiane.lopes@seducam.pro.br) 


A. P. Crósta, Processamento Digital de Imagens de Sensoriamento Remoto 1992 


A imagem de saída produzida pela filtragem mostrada na Figura 6.2 possui 
os valores dos pixels situados nas suas bordas iguais a zero. Isso é devido ao 
chamado efeito de bordas, provocado pelo fato de que a primeira posição da 
janela móvel em que a máscara pode ser aplicada, no caso desta ter 3x3 
elementos, é o segundo pixel da segunda coluna. Esse fato ocorre em todas as 
bordas da imagem, cujos valores de intensidade são então substituídos por zeros. 
Note-se que, no caso de uma máscara de 5x5 elementos, as bordas terão 2 linhas 
e 2 colunas. 

Pode-se notar portanto que operações de filtragem por convolução são 
bastante intensivas do ponto de vista da quantidade de cálculos necessários, 
motivo pelo qual são geralmente demoradas em sistemas de processamento de 
imagens. Por isso, deve-se tomar um certo cuidado de planejar cuidadosamente 
as filtragens a serem aplicadas, tentar implementá-las usando máscaras de 
dimensões pequenas (3x3 ou 5x5) e em imagens igualmente de pequenas 
dimensões (1024x1024 pixels). 

Outro detalhe a respeito das operações de filtragem por convolução é que 
elas produzem geralmente uma imagem com baixo contraste, necessitando a 
aplicação de técnicas de aumento de contraste. Estas podem ser de quaisquer 
tipos, dentre os já tratados anteriormente, sendo o aumento linear de contraste 
a mais comum. 


6.3 Filtros passa baixas ou de suavização 


O nome passa baixas ou de suavização (do termo inglês "smoothing” 
advém do fato que esse tipo de filtro elimina as altas frequências da imagem, 
deixando "passar" somente as baixas frequências. A maior utilização dos filtros 
passa baixas é na remoção de ruídos eletrônicos, comuns em imagens de S.R. 
O grande problema desse tipo de filtro é que o efeito colateral produzido equivale 
a"desfocar" a imagem toda e, consequentemente, perder informações de detalhe. 
Todavia, existem alguns tipos de filtros passa baixas que permitem a retenção de 
detalhes ou bordas. Nesse tipo de filtro a soma dos pesos usados na máscara é 
sempre igual a 1. Outra característica deles é que o efeito de suavização ou 
"desfocagem" aumenta proporcionalmente à dimensão da máscara usada, de tal 
forma que uma máscara 9x9 vai produzir uma imagem muito mais desfocada do 
que uma máscara equivalente de dimensões 3x3. 

Alguns dos tipos mais comuns de filtros dessa família são apresentados a 
seguir. 
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6.3.1 Filtro de Média 
Esse é um dos tipos mais simples de filtros passa baixas e o seu efeito é 


o de substituir o DN do pixel original pela média aritmética do pixel e seus 
vizinhos. Uma máscara de dimensões 3x3 teria então os seguintes pesos: 


máscara quadrada máscara "+ 

1/9 1/9 1/9 1/5 

1/9 1/9 1/9 1/5 1/5 1/5 
1/5 


1/9 1/9 1/9 


Um exemplo da maneira como o filtro de média atua na imagem é mostrado 
na Figura 6.3, para a máscara quadrada de 3x3 acima. 


6.3.2 Filtro de Média Ponderada 
Nesse tipo de filtro passa baixas, uma média ponderada é usada, na qual 
os pesos são definidos em função de sua distância do peso central. Filtros desse 


tipo de dimensões 3x3 são: 


máscara quadrada máscara "+ 

116 1/8 1/16 1/6 

1/8 1/4 1/8 1/6 1/3 1/6 
1/6 


116 1/8 1/16 


O efeito de suavização é menos intenso neste caso, uma vez que o peso 
do pixel central é proporcionalmente maior do que no filtro de média. 
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Pixel 24 + 28 + 22 
= 1/9 +28+50+27] = 27 
— EB +32 +23 


Figura 6.3 - Exemplo de um filtro de média (passa baixas) quadrado de 3x3 atuando na 
imagem original à esquerda, para produzir a imagem filtrada direita. Notar que na imagem filtrada 
os pixels das bordas da imagem não são considerados, pois não possuem todos os 8 vizinhos 
necessários para o cálculo. E mostrado na parte inferior da figura o cálculo necessário para se 
determinar o novo valor de DN do pixel central da imagem filtrada. 


6.3.3 Filtro de Moda 


Considerando-se uma máscara de dimensões pré-definidas (digamos 3x3), 
o pixel central seria substituído pelo valor de DN mais comum dentro da máscara. 
No exemplo da Figura 6.3, o pixel central da imagem original seria substituído 
pelo DN=28, que ocorre duas vezes. Este tipo filtro é bastante útil para "limpar" 
pixels isolados em imagens representando resultados de classificação estatística 
multi-espectral. 


6.3.4 Filtro de Mediana 


Neste tipo de filtro passa baixas, o pixel central da máscara é substituído 
pela mediana dos seus vizinhos. A mediana de um conjunto de, digamos, 9 
números (de uma máscara 3x3) representa neste caso o DN intermediário do 
conjunto. No exemplo da Figura 6.3, a mediana do pixel central seria igual a 28. 
Embora seja um filtro de implementação algo complexa, devido à necessidade de 
um ordenamento dos valores, o filtro de Mediana é um dos filtros de suavização 
que melhor preserva as bordas em uma imagem. 
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6.4 Filtros passa altas ou de realce de bordas 


São filtros que eliminam as feições de baixa frequência, deixando apenas 
as de alta frequência, normalmente expressas por bordas ou limites entre áreas 
de diferente valores de DN. Considerando que uma imagem é composta pela 
soma de suas componentes de alta e baixa frequência, conforme mostrado na 
Figura 6.1, a maneira mais simples de obter uma filtragem passa altas é 
subtraindo a imagem suavizada (passa baixas) da imagem original. 

Assim como nos filtros de suavização, a dimensão da máscara de 
convolução influencia no resultado final. Neste caso, porém, quanto menor a 
máscara, menores serão os detalhes a serem realçados na imagem. Portanto, no 
caso de se desejar realçar feições lineares extensas, como por exemplo falhas 
geológicas, máscaras de grandes dimensões são as mais indicadas. Como regra 
geral, um filtro passa altas normalmente vai realçar feições de dimensões 
menores do que a dimensão da máscara usada. Por exemplo, para realçar 
lineamentos geológicos com cerca de 3 quilômetros de extensão em uma imagem 
TM (onde o pixel tem 30 metros), o ideal é usar uma máscara de dimensões 
31x31 pixels! 

Os tipos mais comuns de filtros passa altas encontram-se a seguir. 


6.4.1 Filtros Laplacianos 


São úteis na detecção de bordas e geralmente a soma dos pesos usados 
na máscara é igual a zero. Existe uma infinidade de tipos de filtros Laplacianos, 
sendo mais comuns os seguintes: 


6.4.2 Filtros Laplacianos+Original 


As imagens produzidas por filtragem passa altas, embora ricas em 
informação textural, são geralmente muito pobres em contraste, com pouca 
informação tonal, sendo portanto de difícil interpretação. Uma maneira de se 
manter o contraste da imagem original, e consequentemente a informação tonal, 
ao mesmo tempo em que se tenha o realce de bordas, é adicionar a imagem 
filtrada à imagem original. Esse processo pode ser aplicado, por exemplo, a 3 
bandas TM as quais, após um aumento de contraste adequado, produzem um 
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excelente produto para interpretação visual, contendo a informação tonal 
expressa por cores e toda a informação textural e de bordas. 

Isso pode na verdade ser feito em uma única etapa de filtragem, através 
do assim chamado filtro Laplaciano+original. Para isso, toma-se as máscaras 
mostradas acima e adiciona-se a unidade ao valor central da máscara, as quais 
passariam então a ser: 


040 afasta 15:20 4 
-4 5 -1 -4 9 -1 D Bu 
040 A 121 


Para se obter bons resultados neste tipo de filtragem, o ideal é adicionar 
a imagem original com um peso muito maior do que a versão filtrada. Desse 
modo, em vez do valor central da máscara ser 5, ele deve variar de 10 a 15, 
dependendo das características da imagem sendo filtrada. Um pouco de 
experimentação com esses valores é recomendável. 


6.5 Filtros direcionais 


Estes filtros são um tipo especial de filtro passa altas, que possuem a 
característica de realçar bordas em direções pré-determinadas. Eles são na 
verdade uma combinação de filtragem passa altas e limiarização de níveis de 
cinza. Os filtros direcionais podem ter apenas uma dimensão (horizontal ou em 
linha e vertical ou em coluna). O problema com este tipo de filtro é que muitas 
vezes eles produzem bordas artificiais, também chamadas de artefatos, que 
podem confundir o intérprete, fazendo-o pensar que se trata de uma feição 
verdadeira. Exemplos desse tipo de filtro unidimensionais (1x2) são: 


vertical horizontal 


1 -A 1 
-1 


Os filtros direcionais podem também ser quadrados, existindo diversos 
tipos deles. Os mais comuns são: 


Filtros de Roberts 


84 


Baixado por Daiane Cardoso Lopes (daiane.lopes@seducam.pro.br) 


A. P. Crósta, Processamento Digital de Imagens de Sensoriamento Remoto 1992 


Filtros de Sobel 


N-S NE-SW E-W NW-SE 
{i8 0 12 PIR -2 -4 0 
0 0 0 Ped EO sf COM 
A pa EA 04 0 12 


Filtros de Prewitt 


N-S NE-SW E-W NW-SE 


i 
Dg 4 a =2 
A Sei Si ca 


=< m A 
1 
— 
1 
— 
1 
— 
1 


Nota-se que, ao contrário dos filtros normais de detecção de bordas, os 
direcionais possuem seus pesos distribuídos assimetricamente ao redor de um 
eixo hipotético. As direções a serem realçadas são paralelas à esse eixo 
hipotético, sendo que o realce se dá num intervalo de 45° para ambos os lados 
em relação à direção de realce. 


6.6 Remoção de ruído por convolução 


As imagens digitais geradas por sensores remotos possuem 
frequentemente imperfeições que são inerentes ao processo de imageamento e 
transmissão. Esse ruído não só representa um fator visualmente desagradável em 
uma imagem, mas também pode afetar algumas técnicas de processamento de 
imagens, as quais são muitas vezes sensíveis à esse tipo de erro. A remoção 
desse ruído pode ser feita por filtragem de frequências. 

O ruído conhecido por "drop-out" é provavelmente o mais comum, e 
também o mais óbvio dos encontrados em imagens de S.R. Ele aparece como um 
valor anômalo, muito mais claro ou escuro do que o "background" local. Muitas 
vezes esse tipo de ruído nem é tão óbvio mas aparecerá nitidamente em 
consequência de alguns tipos de processamento (por exemplo, razão de bandas 
e análise por principais componentes). O método mais comum de eliminá-lo é 
usando um filtro de média, com a desvantagem porém que as bordas presentes 
na imagem serão igualmente suavizadas. Resultados geralmente melhores 
podem ser obtidos com um filtro de Mediana, pois um pixel com ruído tipo "drop- 
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out" será substituído pela mediana em relação aos DNs do pixels vizinhos. Além 
das imagens originais, imagens transformadas por técnicas de processamento 
tais como razão de bandas ou principais componentes, que exibem geralmente 
muito ruído, podem ser visualmente melhoradas através da aplicação do filtro de 
média ou de mediana. 

Um ponto importante ao se usar filtros para remoção de ruídos: assim 
como o ruído, o valor de DN obtido para o pixel defeituoso não é verdadeiro, mas 
sim uma simples aproximação. Desse modo, algum cuidado é necessário com os 
resultados de, por exemplo, classificação multi-espectral realizada sobre bandas 
filtradas para remoção de ruídos. 
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7.1 Introdução 


Várias operações matemáticas simples são usadas em processamento 
digital de imagens de S.R., no sentido de analisar imagens multi-espectrais 
(diferentes bandas espectrais de uma mesma cena) e/ou multi-temporais (bandas 
individuais adquiridas sobre uma mesma área em diferentes datas). São 
normalmente utilizadas duas ou mais imagens da mesma área geográfica, sempre 
previamente co-registradas (isto é, cada pixel das duas imagens se refere 
exatamente à mesma área no terreno). O input de uma operação desse tipo é 
representado então por duas ou mais imagens e o output é uma única imagem 
representando o resultado da combinação das imagens originais de acordo com 
alguma regra matemática, realizada pixel-a-pixel. Alguns exemplos de operações 
aritméticas com imagens são adição, subtração, multiplicação e divisão, esta 
última também conhecida por razão de bandas (band ratio, em inglês). 

Muitas vezes é desejável que a informação espectral contida num conjunto 
de bandas multi-espectrais seja comprimida em um número menor de bandas, 
sendo esse número idealmente igual a 3, para permitir que elas sejam 
combinadas usando-se as três cores básicas (RGB) em ummonitor de vídeo. Isso 
é conhecido como redução da dimensionalidade dos dados originais. As 
técnicas aritméticas aqui tratadas possibilitam essa redução, pois cada imagem 
resultante dessas operações representará uma função da informação espectral 
originalmente contida nas duas ou mais bandas originais usadas como input. Por 
exemplo, se as 6 bandas refletidas do TM forem multiplicadas ou dividas duas a 
duas, produzindo então 3 novas bandas, estas últimas irão conter na verdade as 
informações das 6 bandas originais, caracterizando uma compressão. A questão 
da compressão envolve porém uma perda de informação original, pois nem toda 
a informação original será realçada. Deve-se lembrar que o resultado das 
operações aritméticas sempre ultrapassará o intervalo 0-255, devendo ser 
redimensionada para esse intervalo após a operação; isso acarreta uma perda 
de informação espectral. 

Como regra geral, pode-se dizer que a adição e a multiplicação servem 
para realçar similaridades espectrais entre bandas ou diferentes imagens, ao 
passo que a subtração e a divisão servem para realçar diferenças espectrais. 
Dentre essas operações, a razão de bandas é provavelmente a mais utilizada, 
sendo de particular interesse em aplicações em geologia, agricultura e meio- 
ambiente. 
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7.2 Adição de imagens 


A adição de imagens é a mais simples das operações envolvendo duas ou 
mais imagens. Pela natureza do processo de adição, esta é uma operação 
linear. Uma vez que os valores de intensidades (DNs) das imagens a serem 
somadas se situam no intervalo 0-255, o resultado da adição de N imagens vai 
estar situado no intervalo 0-255 x N. Portanto, alguma forma de compressão de 
contraste se faz necessária para que a imagem resultante possa ser mostrada em 
um monitor de vídeo de 8 bits, comum aos sistemas de processamento de 
imagem. Isso é geralmente obtido dividindo-se o resultado da operação de adição 
por N, o que vai produzir uma compressão de volta ao intervalo 0-255; outra 
maneira é determinar o máximo e o mínimo DN da imagem adicionada, usando 
o valor máximo para determinar o fator de escala para comprimir a imagem no 
intervalo 0-255. 

A adição pode ser vista portanto como uma forma de se obter a média 
aritmética entre as imagens sendo operadas. Uma das aplicações da adição 
baseia-se justamente nessa sua capacidade de produzir uma média aritmética, 
no sentido de diminuir o ruído usualmente presente em imagens de 
sensoriamento remoto. O ruído eletrônico presente em imagens desse tipo não 
é geralmente correlacionado entre diferente bandas espectrais. Isso quer dizer 
que, considerando os pixels individualmente em cada banda espectral da 
imagem, se numa dada banda um determinado pixel apresenta-se com ruído, é 
muito provável que nas demais bandas isso não ocorra. Ao se tirar a média 
aritmética dessas bandas, o ruído desses pixels tende a desaparecer, uma vez 
que os valores de DNs para esses pixels serão determinados pela média dos 
pixels, com e sem ruído. 

Essa capacidade da adição de produzir a média das bandas adicionadas 
pode ser usada também para se redefinir uma nova banda espectral. Isso é 
particularmente útil quando se deseja identificar um objeto ou fenômeno que seja 
caracterizado por feições espectrais bastante largas em termos do intervalo de 
comprimento de ondas, que extrapolam uma ou mais bandas de um sensor. 
Nesses casos, pode ser útil a redefinição de uma "nova" banda, a partir da média, 
digamos, das três bandas da faixa visível do TM (neste caso, bandas 1,2 e 3). 
Considerando os atuais sensores orbitais, que possuem no máximo 7 bandas 
espectrais (o caso do TM), essa capacidade nem sempre é de grande utilidade. 
Considerando porém que já existem em operação sensores aero-portados com 
até 224 bandas espectrais (o AVIRIS, da NASA) e que na próxima década 
deverão existir sensores similares em operação a nível orbital, constata-se que 
a redefinição de bandas por adição poderá vir a assumir importância dentre as 
técnicas de processamento comumente utilizadas. Usando-se como exemplos os 
satélites atuais, essa técnica pode ser utilizada para produzir uma imagem 
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pancromática com as bandas 1,2 e 3 do TM e compará-la com outras imagens 
pancromáticas, tais como as produzidas pelo SPOT/Pan ou pelo sensor RBV do 
satélite LANDSAT 8. 

Outra aplicação para a adição de imagens é a combinação de resultados 
de outros tipos de processamento. Um exemplo disso é a adição de uma 
imagem original à sua versão submetida a um filtro de convolução pare realce de 
bordas. Conforme visto anteriormente, esse processo permite combinar a 
informação tonal da imagem original com a informação textural da imagem 
filtrada, produzindo uma imagem com ótimas características de interpretação. 


7.3 Subtração de imagens 


A subtração entre imagens, sejam elas diferentes bandas de uma mesma 
imagem ou a mesma banda de diferentes imagens, serve para realçar pequenas 
diferenças espectrais, refletidas por diferenças em DNs. Da mesma forma que 
a adição, a subtração representa também uma operação linear, cujos resultados 
vão produzir intensidades fora do intervalo 0-255 (na realidade, o intervalo neste 
caso é de -255 a +255), necessitando portanto de um ajuste de contraste. Esse 
ajuste é implementado adicionando-se 255 ao resultado, o que vai produzir um 
novo intervalo 0-510, e dividindo-se este por 2, retornando portanto ao intervalo 
0-255. 

A diferença, ou subtração, entre bandas é bastante útil na identificação de 
diferenças sutis em comportamento espectral de determinados alvos em imagens 
multi-espectrais. Alguns exemplos são a identificação de diferentes tipos de 
cobertura vegetal utilizando os comprimentos de onda relativos ao infra- 
vermelho próximo, através por exemplo da diferença entre as bandas 6 e 7 do 
MSS, e a quantidade de vegetação presente, usando a diferença MSS7-MSS5. 
Outro exemplo é a identificação de minerais formados por óxidos de ferro, 
que exibem alta reflectância no vermelho e baixa reflectância no azul, de forma 
que uma diferença entre as bandas 3 (equivalente ao vermelho) e a 1 (azul) do 
TM vai realçar as áreas com solos ricos em material ferruginoso, tais como 
formações lateríticas. Tendo-se em mente as curvas de comportamento espectral 
dos alvos de interesse, bem como o posicionamento das bandas dos sensores 
disponíveis, é possível então traçar uma estratégia de realce de diferenças 
espectrais, usando-se a subtração de bandas. 

Outra aplicação bastante comum da subtração é na detecção de padrões 
de mudança da cobertura em imagens. Essas mudanças da cobertura podem 
significar uma infinidade de fenômenos, tais como desmatamento, mudanças no 
uso do solo, diferenças sazonais na vegetação, expansão de áreas urbanas, 
diferenças no sombreamento topográfico devido à mudanças sazonais no angulo 
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de iluminação solar e muitas outras. Para isso são usadas duas imagens da 
mesma banda do mesmo sensor, porém tomadas em diferentes épocas, por 
exemplo, com alguns anos de diferença. Calculando-se a diferença entre essas 
imagens e observando-se o histograma dessa nova imagem, o resultado será 
similar ao apresentado na Figura 7.1. O histograma possui uma distribuição 
normal, com um pico no DN=127 e caindo rapidamente em ambos os seus lados. 
O pico em 127 representa os pixels que não mudaram no período de tempo 
considerado, ao passo que os picos menores em ambos os lados do 
histograma representam os pixels que mudaram. 

Um ponto importante acerca da subtração de imagens diz respeito à 
existência de diferenças de contraste entre as duas imagens a serem 
subtraídas. Ocorre que muitas vezes as duas imagens possuem diferentes 
médias e contrastes entre si, ou seja, seus histogramas não coincidem em 
termos de média e desvio-padrão. Se essas duas imagens forem subtraídas 
dessa forma, o que vai acontecer é que a informação que é comum a ambas não 
será atribuída ao valor 127 do exemplo da Figura 7.1, mas haverá uma maior 
tendenciosidade em relação à imagem com maior contraste. A solução nesse 
caso é aplicar um aumento de contraste adequado a ambas as imagens, antes da 
subtração, para equalizar a média e o desvio-padrão de seus histogramas. Isso 
deve ser feito com uma técnica de aumento de contraste linear, tal como aquela 
denominada "Realce de Contraste Balanceado” vista anteriormente. 


Frequencia 


o 100 127 150 255 


Nivel de Cinza 


Figura 7.1 - Histograma de uma imagem produzida pela subtração de duas outras. 
Pixels que não apresentam nenhuma diferença possuem valor 127. Os pixels com 
maior diferença estão entre 0-100 e entre 150-255. 
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7.4 Multiplicação de imagens 


A multiplicação de imagens não é uma técnica de uso frequente em 
processamento de imagens de sensoriamento remoto. Trata-se de uma operação 
não-linear, capaz de gerar resultados bastante fora do intervalo 0-255. Dois 
pixels com valor 255, quando multiplicados, darão um valor de 65.025. Isso 
requer uma compressão de contraste bastante intensa, para que o resultado 
possa ser exibido em um monitor de vídeo de 8 bits. 

Assim como na adição, na multiplicação a informação que é comum a 
ambas as imagens sendo multiplicadas é realçada. Isso porque, no caso de 
um pixel de uma das imagens ter um DN alto, enquanto o mesmo pixel na outra 
possui um DN baixo, o resultado será baixo (notar que, se um deles possui DN=0, 
o resultado da multiplicação será 0); já se ambos tiverem alto DN, o resultado 
será altíssimo, realçando portanto a informação representada por números 
digitais altos. Uma vez que, nas imagens de sensoriamento remoto, a informação 
que é comum a duas ou mais bandas é geralmente causada pelo efeito de 
sombreamento topográfico, pode-se deduzir que o produto da multiplicação de 
2 imagens de S.R. geralmente realça as feições morfológicas, sendo portanto 
útil naquelas aplicações em que essas feições são importantes: geologia 
estrutural, geomorfologia, cartografia e outras. 

Com base nessa propriedade da multiplicação, uma técnica de integração 
ou de combinação de imagens foi desenvolvida. Ela permite que, dado um 
conjunto de 3 bandas com pouca ou nenhuma correlação entre si (ou seja, que 
não repitam informação espectral entre elas), que se deseja combinar como uma 
composição colorida, e uma quarta imagem que não apresente correlação com 
as 3 anteriores, se torne possível a obtenção de uma composição colorida que 
representa na verdade 4 dimensões ou componentes espectrais. Essa técnica é 
muito útil quando se quer combinar, por exemplo, 4 componentes principais 
geradas pelo TM as quais, como veremos em uma próxima seção, não possuem 
correlação. Neste caso, toda a informação morfológica (textural) fica concentrada 
na 1º componente, que é denominada de componente acromática, ao passo 
que a informação espectral (tonal) é distribuída pelas demais três componentes, 
denominadas componentes cromáticas; ao se combinar essa 4 imagens 
através da multiplicação da 1º componente pelas três outras, obtém-se uma 
imagem de 4 dimensões: uma dimensão textural, com a informação morfológica, 
a qual controla a intensidade da composição colorida e três dimensões tonais, 
contendo a informação espectral, as quais controlam distribuição de cores. Esse 
método serve também para combinar uma imagem SPOT pancromática (10 
metros de resolução espacial), como a componente acromática, com 3 imagens 
TM não correlacionadas, as quais podem ser 3 componentes principais, 3 razões 
de bandas ou 3 bandas realçadas por decorrelação. Essa combinação possui a 
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enorme vantagem de apresentar, numa mesma imagem colorida, a informação 
textural/morfológica com uma resolução espacial de 10 metros, ao mesmo tempo 
que contém a informação espectral das 3 imagens cromáticas. 


7.5 Divisão de imagens (razão de bandas) 


A divisão de imagens é sem dúvida a operação aritmética mais comum em 
processamento digital de imagens de S.R., sendo bastante utilizada na 
determinação dos chamados índices de biomassa ou de vegetação e também 
na identificação de zonas de alteração hidrotermal relacionadas a 
concentrações de minerais. A exemplo da multiplicação, ela também é uma 
operação não-linear e produz resultados que necessitam ser re-escalados para 
o intervalo 0-255 antes de serem mostrados no monitor de vídeo. A divisão serve 
para realçar intensamente as diferenças espectrais de um par de bandas, 
sendo que os extremos branco e preto da distribuição de níveis de cinza 
representam as maiores diferenças em reflectância entre as duas bandas 
consideradas. A divisão é feita pixel-a-pixel entre duas bandas e, quando o DN 
do denominador da divisão é maior do que o do numerador, o resultado é menor 
do que 1, dando um resultado que será obviamente representado por um pixel 
escuro. Ao contrário, quando o numerador for maior do que o denominador, a 
divisão será maior do que 1, dando um pixel claro no resultado. Quando os 
valores do denominador e do numerador forem os mesmos, não há diferença 
entre as duas bandas para aquele pixel. 

Existem alguns problemas práticos com a divisão de bandas. 
Primeiramente, existe a questão do ruído eletrônico existente nas razões, o 
qual, por ser não correlacionado entre as bandas, tende a ser exagerado pela 
divisão (um alto valor espúrio tanto no numerador quanto no denominador vai 
produzir um valor extremo, branco ou preto). O alto conteúdo em ruído 
normalmente presente em razões de banda pode ser removido usando-se então 
os filtros tratados anteriormente. 

Outro problema diz respeito ao espalhamento atmosférico da radiação 
solar, o qual varia de acordo com o comprimento de onda considerado e, 
portanto, vai afetar diferentemente cada banda. Esse efeito atmosférico 
diferencial, chamado eminglês de "atmospheric scattering", precisa ser removido 
antes de se calcular uma razão de bandas, do contrário o resultado será espúrio 
e não representará a diferença de reflectância entre os pixels das duas bandas. 
Existem diversas técnicas para estimar o espalhamento atmosférico para cada 
banda, algumas até bastante sofisticadas estatisticamente, mas o modo mais 
simples e rápido é o chamado subtração de pixel escuro ("dark pixel 
subtraction"). Ela se baseia na subtração de um valor de cinza, o qual 
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representaria o efeito de espalhamento, determinado para cada banda 
individualmente. A determinação desse valor de cinza é feita empiricamente, com 
base no fato de que áreas com águas profundas devem refletir a radiação solar, 
aparecendo com DN próximo a zero (águas rasas geralmente possuem 
sedimentos em suspensão, os quais refletem a radiação e, portanto, não servem 
para este propósito). Neste caso, é necessário que exista ao menos uma área de 
águas profundas na imagem, para que sejam definidos os valores a serem 
subtraídos de cada banda. Na falta destas, áreas de sombra topográfica intensa 
podem servir como uma aproximação. 

Um terceiro problema é relacionado a materiais com características de 
reflectância semelhantes, porém com diferentes intensidades. A Figura 7.2 mostra 
as linhas de mesma razão para um par de bandas. Notar que a linha de razão 
igual a 1 está a 45º, representando todos os pixels que possuem o mesmo valor 
de intensidade nas duas bandas, o que é típico de imagens correlacionadas. 
Qualquer pixel cujas intensidades espectrais plotam ao longo de uma dessas 
linhas será representado pelo mesmo valor de intensidade na imagem resultante, 
independentemente da sua distância a partir da origem. Essa característica 
também mostra uma das maiores limitações da imagens de razão: se dois objetos 
distintos possuem cores similares, porém diferentes intensidades médias (também 
chamado de albedo), as suas intensidades vão estar ao longo de uma mesma 
linha de razão constante. Embora fossem perfeitamente separáveis nas imagens 
originais, esses objetos se tornariam indistinguíveis na imagem produzida pela 
divisão. A Figura 7.3 exemplifica esse caso. 


98 


Baixado por Daiane Cardoso Lopes (daiane.lopes(seducam.pro.br) 


A. P. Crósta, Processamento Digital de Imagens de Sensoriamento Remoto 1992 


255 


1 
m 
E 2.5 
an 
ed 
E 

ø. 23 
B Imagem A 255 


Figura 7.2 - Linhas de mesma razão representadas no scattergrama 
bidimensional de duas imagens A e B. 
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Figura 7.3 - Os objetos 1, 2 e 3 possuem diferentes 
intensidades e poderiam ser diferenciados considerando-se 
essas duas bandas. Ao se dividir essas bandas, os objetos 1 
e 2 passariam a ser indistinguíveis, pois encontram-se sobre 
uma mesma linha de razão constante, apesar do objeto 2 


possuir mais contraste do que o objeto 1. (Modif. de Canas, 
1987). 
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Outra característica das imagens produzidas pela divisão de bandas é a 
ausência do sombreamento topográfico. Isso se deve ao fato que o 
sombreamento representa informação espectral que é altamente correlacionada 
entre as diversas bandas e, portanto, os pixels sombreados vão plotar ao longo 
da linha de mesma razão (igual a 1) da Figura 7.2 e vão ser suprimidos do 
resultado. Pode-se dizer portanto que as razões de banda minimizam as 
diferenças nas condições de iluminação de uma cena, conforme mostrado na 
Figura 7.4. Ocorre que, se a correção do espalhamento atmosférico não for feita 
com precisão, o efeito de sombreamento não será totalmente eliminado. 

A propriedade mais importante da razão de bandas, e o motivo pelo qual 
ela é bastante utilizada, é a sua capacidade de realçar imensamente 
determinadas feições da curva de assinatura espectral dos alguns materiais 
naturais. Se as bandas a serem divididas forem selecionadas de forma a cobrir 
máximos e mínimos de absorção, assim como mudanças na inclinação da curva 
de assinatura, elas podem ser combinadas em pares de razões, para acentuar 
aspectos das assinaturas espectrais dos materiais. 


o — —— q 
Noroeste Sudeste 


Figura 7.4 - Supressão de diferenças em iluminação de banda. A área pontilhada representa um 
tipo de rocha (arenito vermelho) que possui DN=94 na banda TM3 na área iluminada pelo sol 
e DN=76 na área sombreada. Já na banda 1 ela tem DN=42 na área iluminada e DN=34 na 
sombreada. Fazendo-se a tazão TM3/TM1, obtêm-se um DN=2.24 para a área iluminada e 
Dn=2.23 para a sombra, eliminando-se portanto a diferença (Modif. de Sabins, 1987). 
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Um exemplo simples é a vegetação, que é caracterizada por uma 
intensa absorção devido à clorofila na região do vermelho e por uma intensa 
reflexão no infra-vermelho próximo. Fazendo-se uma composição colorida 
usando essas bandas e outra qualquer, a presença de vegetação é óbvia, mas 
variações em intensidade, tipos, etc., não são fáceis de se identificar, 
simplesmente porque o olho humano possui um intervalo limitado de percepção. 
Contudo, essas variações possuem o efeito de mudar a estrutura da curva de 
reflectância espectral, particularmente no tocante à intensidade do mínimo de 
absorção da clorofila, o máximo de reflexão no infra-vermelho e o gradiente da 
curva entre o vermelho e o infra-vermelho. Pequenas mudanças nesses 
parâmetros possuem um efeito desproporcionalmente alto na razão das bandas 
correspondentes (MSS7/MSS5 ou TM4/TM1), de tal forma que as variações são 
muito mais facilmente interpretadas em uma razão de bandas. 

Por esse motivo, razões de diversos tipos são utilizadas em estudos de 
vegetação para estimar a proporção de biomassa e para diferenciar entre 
diferentes espécies. Essa é a base para se definir razões de bandas mais 
complexas, desenvolvidas para estudos de vegetação, que envolvem divisão, 
soma e diferença entre bandas espectrais. A mais conhecida delas é o chamado 
Índice Normalizado de Diferença de Vegetação (NDVI), originalmente 
desenvolvido para o MSS e posteriormente utilizado em escala global com o 
sensor de baixa resolução espacial denominado AVHRR. Nesses dois casos, o 
NDVI é calculado da seguinte maneira: 


MSS AVHRR 
MSS7 - MSS5 B2 - B1 
NDVI = ss77 MES NDVI = -557517 


Da mesma forma, aplicações de razões de banda são bastante úteis em 
prospecção mineral. Neste caso, duas feições espectrais de interesse são 
geralmente utilizadas, uma delas relacionada à presença de óxidos de ferro 
(geralmente hematita e/ou goethita, sob o nome genérico de limonita), que são 
encontrados em associação com mineralizações de sulfetos, para a qual se usa 
as razão MSS6/MSS7 ou, mais eficaz, a razão TM3/TM1, entre outras possíveis. 

A segunda feição espectral passível de ser realçada diz respeito a 
presença de minerais de argila de alteração hidrotermal, os quais são 
extremamente realçados na razão TM5/TM7 e que se associam à mineralizações 
auríferas. Na prática, o que se faz é selecionar três diferentes razões, tentando 
cobrir todas as feições espectrais de interesse, e produzir uma composição 
colorida de razões ("color ratio composite”), que não só sintetiza numa só 
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imagem a informação de pelos menos 6 bandas, mas também otimiza os 
contrastes de assinatura espectral entre diversos tipos de materiais superficiais. 
Por outro lado, as cores obtidas através dessa composições não possuem relação 
com aquelas obtidas por simples composições coloridas de bandas originais, 
necessitando para sua interpretação uma boa dose de raciocínio com base nas 
razões individuais e nas curvas espectrais dos materiais que se deseja realçar. 
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8.1 Introdução 


Um dos principais objetivos do sensoriamento remoto é o de distinguir 
entre e identificar as composições de diferentes materiais superficiais, sejam 
eles tipos de vegetação, padrões de uso do solo, rochas e outros. Essa distinção 
e identificação torna-se possível devido ao fato dos materiais superficiais terem 
comportamentos específicos ao longo do espectro eletromagnético, 
comportamentos esses que podem portanto ser usados para identificá-los. 

A classificação automática de imagens multiespectrais de sensoriamento 
remoto diz respeito à associar cada pixel da imagem a um "rótulo" 
descrevendo um objeto real (vegetação, solo, etc.). Dessa forma, os valores 
numéricos (DNs) associados à cada pixel, definidos pela reflectância dos 
materiais que compõem esse pixel, são identificados em termos de um tipo de 
cobertura da superfície terrestre imageada (água, tipo de vegetação, de solo, de 
rocha, etc.), chamadas então de temas. 

Quando esse tipo de operação é efetuado para todos os pixels de uma 
determinada área, o resultado é um mapa temático, mostrando a distribuição 
geográfica de um tema, tal como vegetação ou solo. Pode-se dizer então que uma 
imagem de sensoriamento remoto classificada é uma forma de mapa digital 
temático. Quando essa imagem é reorganizada para se ajustar à uma dada 
projeção cartográfica, torna-se um importante elemento para ser incorporado a 
um sistema geográfico de informações. 


8.2 O espaço de atributos 


O gráfico contendo as frequências de distribuição de intensidades de duas 
bandas de uma imagem multiespectral, visto anteriormente como um histograma 
bidimensional, define o chamado espaço de atributos (em inglês, "feature 
space”). O conceito de espaço de atributos é essencial para se entender como 
funciona a classificação de imagens multiespectrais. A Figura 8.1 mostra um 
gráfico de espaço de atributos, para o caso de uma imagem com apenas duas 


107 


Baixado por Daiane Cardoso Lopes (daiane.lopes(seducam.pro.br) 


A. P. Crósia, Processamento Digital de Imagens de Sensoriamento Remoto 1992 


bandas espectrais. Nesse espaço encontram-se plotados 1 pixel de três 
diferentes tipos de materiais superficiais, denominados A, Be C. Se apenas a 
banda 1 for considerada, é fácil notar que os materiais B e C não poderiam ser 
separados, pois ambos mostrar-se-iam com um DN de aproximadamente 200. 
Porém, ao se considerar conjuntamente as bandas 1 e 2, esses três materiais 
superficiais teriam uma posição única no espaço de atributos, que lhes seria 
característica, servindo portanto para distingui-los e identificá-los dos demais. 


Figura 8.1 - Duas bandas espectrais de uma imagem multiespectral 
plotadas uma contra a outra, formando um espaço de atributos, contendo 
as característica espectrais de pixels de três tipos diferentes de materiais 
superficiais A, Be C 


No caso da imagem ser composta de mais de duas bandas, o que é uma 
norma em sensoriamento remoto, o espaço de atributos tem que ser considerado 
para cada par de bandas do conjunto, uma vez que ele é normalmente um espaço 
bidimensional. 

Para identificar perfeitamente os materiais A, Be C da Figura 8.1 o ideal 
seria não se basear nos DNs de apenas um pixel de cada material, mas sim numa 
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amostragem mais representativa. Isso porque qualquer material superficial vai 
apresentar variações nas intensidades dos pixels que o compõem, devido a 
fatores como mistura de quantidades variáveis de outros materiais superficiais, 
diferentes condições de iluminação, presença de ruído do sensor e outros. Desse 
modo, o que se usa é na verdade é um intervalo de DNs, o qual representaria 
as intensidades dos pixels do material superficial em questão. A Figura 8.2 mostra 
um quadro mais "real" da distribuição dos três materiais, com as respectivas 
intensidades máximas e mínimas para cada um. 


Figura 8.2 - Os materiais A, B e C são agora representados pelas áreas 
ocupadas pelos pixels que os compõem, sendo que para cada uma são 
mostrados os intervalos de intensidade máximo e mínimo na Banda 2 (Modif. De 
Dury, 1989) 


As áreas mostradas na Figura 8.2 são conhecidas por classes e são 
definidas pela existência de "nuvens" (em inglês, “clusters” de alta 
concentração de pixels no espaço de atributos. Cada uma dessas classes se 
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refere portanto a um tipo ou mistura de tipos de materiais superficiais. 

Os intervalos máximo e mínimo na Figura 8.2 exemplificam o problema da 
caracterização de classes com base em uma só banda. Observando-se o eixo da 
Banda 2, nota-se que existe uma superposição bastante grande entre os 
intervalos relativos às classes A e B. Os pixels que estiverem seus DNs situados 
entre 93 e 134 na Banda 2 não poderiam ser classificados como pertencentes à 
A ou à B apenas com base nessa banda espectral. O mesmo ocorreria na Banda 
1, entre parte dos pixels pertencentes às classes B e C. Eventualmente, poderia 
haver uma outra banda, digamos Banda 3, na qual essas três classes plotariam 
separadas no espaço de atributos, como mostrado na Figura 8.8. 


Figura 8.3 - Espaço de atributos para a mesma imagem da Figura 8.2, 
porém com uma banda diferente, Banda 3, no eixo horizontal, mostrando 
agora a separabilidade das classes A, B e C na banda 3 (não há 
superposição de intervalos de intensidade). (Modif. De Dury, 1989) 


Uma vez analisado esse conceito de espaço de atributos e observado o 
exemplos das Figuras 8.2 e 8.3, é fácil entender a influência do número de 
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bandas na capacidade de se identificar um tipo de material superficial. Nesse 
sentido, viu-se que com apenas uma banda espectral seria difícil separar as 
classes A de B, ou B de C. Já considerando-se 3 bandas, duas a duas, essa 
separação tornar-se-ia simples para este exemplo. No mundo real as situações 
são bem mais complicadas, assim como é maior o número de diferentes tipos de 
superfícies a serem separadas. Existe grande probabilidade de que as situações 
reais não sejam solucionadas com apenas uma ou duas bandas espectrais. 
Nesse caso, é essencial que se disponha de um número bem maior de bandas, 
para que uma boa caracterização espectral das superfícies seja alcançada. 
Portanto, como regra geral pode-se dizer que quanto maior o número de 
bandas espectrais, maior será a precisão da classificação. 


8.3 Conceitos básicos de classificação multiespectral 


O processo de classificação multiespectral consiste em atribuir cada pixel 
de uma imagem a uma de um grupo de classes, conforme visto anteriormente. 
Essa atribuição é feita com base em observações no pixel em si e na sua 
vizinhança e com base numa série de regras. Alguns pontos básicos surgem 
dessa definição. Primeiro, assume-se que um conjunto de classes foi previamente 
determinado antes de se iniciar a classificação, classes essas cujas propriedades 
são bem conhecidas. Segundo, assume-se que qualquer pixel na imagem 
pertence necessariamente à uma dessas classes. Terceiro, que as classes podem 
ser definidas usando algumas propriedades observáveis da cena e não apenas 
valores de reflectância. 

O maior problema da classificação é que ela representa uma 
simplificação bastante grande em relação à enorme complexidade existente 
em uma cena de satélite. O que ocorre é que as classes pré-definidas são 
normalmente incompletas em relação à realidade, ou são uma mistura 
extremamente variável de uma série de superfícies reais. Pode-se chegar ao 
extremo de se definir classes que não existem ou que não podem ser 
diferenciadas com base nos dados multiespectrais disponíveis. Daí a necessidade 
de se verificar o resultado das classificações em relação à dados 
conhecidos. Quaisquer informações sobre os objetos/superfícies a serem 


111 


Baixado por Daiane Cardoso Lopes (daiane.lopes(seducam.pro.br) 


A. P. Crósia, Processamento Digital de Imagens de Sensoriamento Remoto 1992 


classificados são portanto um auxílio importante à classificação. 

Um outro ponto sobre a classificação é que a maioria das técnicas 
disponíveis se baseiam apenas no agrupamento de valores de intensidade 
espectral, representados pelos DNs presentes na imagem. Sabe-se que o 
conteúdo de informação de uma imagem de sensoriamento remoto se baseia 
tanto na intensidade (nível de cinza ou cor) de cada pixel individual, como no 
arranjo espacial dos pixels (textura e forma). Ocorre que as técnicas-padrão de 
classificação só dão conta das características espectrais, deixando de lado as 
texturais. Nesse sentido, a classificação apresenta resultados satisfatórios na 
indicação de tipos de cobertura caracterizadas apenas por variações de 
intensidade. Exemplos de aplicações típicas de classificação em sensoriamento 
remoto são o reconhecimento de tipos de cobertura vegetal e uso de solo. 

Existem essencialmente duas abordagens na classificação de imagens 
multiespectrais de sensoriamento remoto. A primeira delas denomina-se 
classificação supervisionada e nela o usuário identifica alguns dos pixels 
pertencentes às classes desejadas e deixa ao computador a tarefa de localizar 
todos os demais pixels pertencentes aquelas classes, baseado em alguma regra 
estatística pré-estabelecida. 

A segunda abordagem é chamada de classificação não-supervisionada 
e nela o computador decide, também com base em regras estatísticas, quais as 
classes a serem separadas e quais os pixels pertencentes a cada uma. A base 
teórica desses dois tipos de classificação será apresentada a seguir, após a 
abordagem do tipo mais simples de classificação, conhecido por fatiamento, e que 
na verdade não se encaixa em nenhuma dessas duas categorias. 


8.4 Fatiamento de níveis ("level slicing") 


O fatiamento de níveis de intensidade representa a forma mais simples de 
classificação e é aplicado a uma única banda espectral de cada vez. Ele é na 
verdade uma forma de aumento de contraste e, como tal, pode ser especificado 
por uma curva de transferência, conforme mostrado na Figura 8.4. A operação de 
fatiamento consiste simplesmente em realçar os pixels cujas intensidades se 
situam dentro de umintervalo especificado (a fatia), isto é, entre um máximo e um 
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mínimo. O fatiamento é geralmente feito de modo interativo, no qual o usuário 
define tanto a largura como o centro do intervalo desejado. Essa fatia é então 
ajustada até que a(s) feição(ões) de interesse seja(m) realçada(s) e separadas 
das áreas sabidamente diferentes, sendo então representadas por um mesmo 
DN. 


M = centro da fatia 
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Imagem de entrada 


Figura 8.4 - Função de transferência para o fatiamento de níveis de 
intensidade. Notar que todos os pixels cujas intensidades não caiam dentro do 
intervalo escolhido serão atribuídos ao valor 0, desaparecendo portanto. 


Da forma representada na Figura 8.4, a imagem submetida a fatiamento 
apareceria toda escura, nela aparecendo apenas os pixels cujos DNs se situam 
no intervalo escolhido. Alguns sistemas de processamento de imagem permitem 
que o fatiamento seja representado de uma forma mais adequada à interpretação, 
mostrando a imagem original ao fundo e o intervalo de níveis fatiado mostrado em 
alguma cor. 

O fatiamento de uma única banda espectral pode ser estendido para o 
domínio multiespectral através de uma série de etapas, descritas a seguir. Com 
isso, aumenta-se a precisão da classificação, uma vez que a superfície que se 
deseja classificar terá uma maior probabilidade de se diferenciar das outras 
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presentes na imagem, quanto maior for o número de bandas considerado. 

Para isso, toma-se cada banda espectral e define-se uma região 
previamente conhecida, contendo a superfície de interesse. Em seguida, aplica- 
se o fatiamento à primeira banda, definindo-se os parâmetros (centro e largura 
da fatia), até que a região de interesse seja realçada, juntamente com os outros 
pixels dessa banda que possuam o mesmo DN da região de interesse. Salva-se 
esse resultado e repete-se o processo para cada uma das bandas espectrais 
disponíveis. Finalmente, combina-se todas as bandas fatiadas em uma só 
imagem, através de adição aritmética. As áreas que apresentarem-se com umalto 
DN (branco) na imagem resultante serão aquelas com as mesmas características 
de reflectância da região conhecida em todas as bandas, ao passo que as áreas 
com tonalidades decrescentes de cinza (mas não totalmente brancas), 
representarão as áreas com características tonais semelhantes à área de 
interesse em apenas algumas bandas. 


8.5 Classificação supervisionada 


Nesse tipo de classificação, é necessário que o usuário conheça alguma 
coisa da área a ser classificada, antes de iniciar o processo. Idealmente, 
deveriam haver locais específicos dentro da área a ser classificada onde 
observações de campo tivessem sido efetuadas durante a passagem do satélite 
para adquirir a imagem. Esse tipo de observação é conhecida como verdade 
terrestre ("ground truth”. Essas áreas podem então ser usadas como um padrão 
de comparação, com a qual todos os pixels desconhecidos da imagem serão 
comparados para se decidir a qual classe pertencem. Essa situação ideal na 
maioria das vezes não é possível, sendo necessário fazer certas inferências 
sobre as classes superficiais. Por exemplo, uma área de alta turbidez na água do 
mar dentro de um estuário muito provavelmente contem sedimentos em 
suspensão, ao passo que uma área em terra com uma reflectância alta no infra- 
vermelho próximo e uma baixa reflectância no comprimento de onda do vermelho 
quase certamente representa área de densa cobertura vegetal. Essas áreas 
seriam então, por inferencia, representativas das classes "sedimentos em 
suspensão" e "vegetação densa", respectivamente. 
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Uma área da imagem que o usuário identifica como representando uma das 
classes é chamada de área de treinamento. Uma área de treinamento é 
normalmente definida pelo usuário traçando-se seus limites diretamente sobre a 
imagem, no monitor de vídeo do sistema de processamento de imagens. Várias 
áreas de treinamento podem ser definidas para uma mesma classe, para 
assegurar que os pixels a ela pertencentes são realmente representativos dessa 
classe. 


Todos os pixels dentro de uma área de treinamento para uma dada classe 
constituem o chamado conjunto de treinamento para aquela classe. À cada 
classe de uma imagem é atribuído o seu próprio conjunto de treinamento. Os DNs 
dos pixels do conjunto de treinamento em cada uma das bandas espectrais são 
então comparados com os DNs de cada pixel da imagem, para decidir à qual 
classe estes pertencem. Geralmente, a precisão da classificação aumenta com 
o número de bandas usadas mas, por outro lado, os cálculos necessário à 
classificação se tornam mais demorados e complexos. 

Existe uma variedade de métodos através dos quais os pixels 
desconhecidos podem ser comparados comos pixels do conjunto de treinamento. 
Em cada caso, o produto final é uma imagem classificada, representando então 
um mapa temático. Esta é na verdade uma imagem comum, formada por uma 
única banda, em cima da qual os pixels atribuídos à cada classe são exibidos em 
cores ou tons de cinza distintos. Normalmente, a classificação é feita em cima de 
três ou mais bandas espectrais, fazendo uso do poder de discriminação adicional 
que elas oferecem. 

Os métodos de classificação mais comuns na análise de imagens de 
sensoriamento remoto são ilustrados a seguir, usando-se o espaço de atributos 
em duas dimensões espectrais para melhor compreensão. São eles: para- 
lelepípedo, distância mínima e máxima verossimilhança. 


8.5.1 Método do paralelepípedo 


A Figura 8.5 ilustra um conjunto de treinamento composto de 23 pixels 
pertencentes à classe A, representado no espaço de atributos da banda 1 versus 
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banda 2. Vinte pixels desconhecidos são incluídos no exemplo (na prática esse 
número é bem maior). O método do paralelepípedo considera uma área no 
espaço de atributos ao redor do conjunto de treinamento. Essa área tem a forma 
de um quadrado ou paralelepípedo, definido pelo DN máximo e mínimo do 
conjunto de treinamento. Todos os pixels situados dentro do paralelepípedo serão 
classificados como pertencentes à classe A. 
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BANDA 2 


BANDA 1 


200 255 


conjunto de pixels de treinamento para a classe A 


pixel desconhecido 


Figura 8.5 - Diagrama do espaço de atributos das classes A, Be C da figura 1, mostrando 
a localizaçái dos pixels pertencentes a um conjunto de treinamento (representado por 
quadrados) e a pixels desconhecidos (representados por “+"). As localizações onde um pixel 
desconhecido coincide com um pertencente ao conjunto de treinamento são representadas 


por um “+” dentro de um quadrado. Os limites de decisão de uma classificador de 
paralelepípedo são mostrados ao redor da classe A. (Modif. De Dury, 1989) 


Os lados do paralelepípedo constituem os chamados limites de decisão 
da classe A. Observa-se que, ademais dos pixels desconhecidos (representados 
na figura por um +) que realmente pertencem à classe A, pois estão situados 
dentro dos seus limites verdadeiros (definido pela elipse), foram classificados 
como também pertencentes à essa classe três pixels que estavam fora da elipse, 
porém dentro do paralelepípedo. Isso exemplifica um dos problemas que afetam 
o classificador de paralelepípedo: a correlação normalmente existente entre 
bandas vai causar uma distribuição alongada ao longo do eixo de 45º do espaço 
de atributos e os limites de decisão definidos por um retângulo ou quadrado vão 
sempre abranger alguns pixels não pertencentes à classe. 

Uma outra característica dos classificadores de paralelepípedo é que, 
numa imagem típica de S.R., contendo milhares de pixels, a maioria deles vai 
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provavelmente cair fora dos limites de decisão das classes, por mais classes que 
se defina. Isso é devido ao fato de que o volume do espaço de atributos que não 
pertence à nenhuma das classes é bastante grande. 


8.5.2 Método da distância mínima 


Na maioria das situações reais encontradas em imagens de S.R., o DN dos 
pixels vai representar na verdade uma mistura de mais de um tipo de superfície, 
isso porque em uma área de 30x30 ou de 80x80 metros, equivalentes aos pixels 
do TM e do MSS respectivamente, é bastante provável que mais de um tipo 
ocorra. Neste caso, como um pixel contendo 40% de grama e 60% de mata 
deveria ser classificado? O DN de um pixel desse tipo vai representar na verdade 
uma mistura da resposta espectral da grama com a da mata. Uma solução 
neste caso é atribuir cada pixel desconhecido à uma ou outra classe, dependendo 
de qual classe ele está mais próximo. Essa questão da proximidade ou da 
similaridade irá permear a discussão dos dois métodos restantes de 
classificação supervisionada. 

Pode-se considerar a questão da proximidade entre classes com base em 
dados estatísticos. Uma forma de definir cada classe é calculando-se a média 
estatística para cada classe em cada banda espectral. Essa médiasitua-se em 
algum lugar próximo ao centro de cada elipse da Figura 8.6 abaixo. O método da 
distância mínima atribui cada pixel desconhecido à classe cuja média é mais 
próxima a ele. 
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Figura 8.6 - Espaço de atributos das classes A, Be C mostrando a posição das 
médias de cada classe e dos dois pixels desconhecidos não classificados pelo 
método do paralelepípedo da Figura 8.5. Pelo método da distância mínima, o pixel 
seria atribuído à classe A e o pixel 2 à classe B. (Modif. De Drury, 1989) 


O pixel desconhecido 1 situa-se mais próximo da classe A, sendo a ela 
atribuído, ao passo que o pixel 2, pelo mesmo raciocínio, é atribuído à classe B. 
Porém, observando-se os limites da classe A pode-se notar que ela ocupa uma 
região maior no espaço de atributos do que a classe B. Isso significa que um pixel 
que está a uma mesma distância das médias das classes A e B deveria ter na 
verdade uma maior afinidade com a classe A. Essa questão não consegue ser 
resolvida pelo método da distância mínima, sendo necessário o uso de 
parâmetros estatísticos mais sofisticados para ponderar o peso de cada classe 
na decisão de atribuir os pixels baseada na distância. 
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8.5.3 Método da máxima verossimilhança (MaxVer) 


O método mais comum que considera a ponderação das distâncias das 
médias utiliza parâmetros estatísticos e denomina-se método da máxima 
verossimilhança (em inglês, "maximum likelihood"). A base estatística desse 
método é razoavelmente complexa e será exemplificada aqui de maneira gráfica. 
Devido à essa complexidade, esse método utiliza um tempo bem maior de 
computação do que os dois anteriores. 

Para que a classificação por máxima verossimilhança seja precisa o 
suficiente, é necessário um número razoavelmente elevado de pixels para cada 
conjunto de treinamento, número esse preferencialmente acima de uma centena. 
Esse número permite uma base segura para tratamento estatístico. Devido a esse 
número alto de pixels, não é possível representá-los graficamente de maneira 
individualizada, como na Figura 8.5. Usa-se neste caso isolinhas ou curvas de 
contorno no espaço de atributos, representando a densidade de pixels do 
conjunto de treinamento para cada região, conforme mostrado na Figura 8.7. 

Na realidade, os contornos da Figura 8.7 representam um ajuste baseado 
em distribuições normais ou Gaussianas dos pixels das áreas de treinamento, 
do contrário os contornos seriam totalmente irregulares, o que não seria desejável 
devido à dificuldade de se computá-los. Ressalta-se que, devido a esse ajuste, 
os contornos são simétricos ao redor da média e sua forma será circular se os 
desvios-padrão nas duas bandas forem os mesmos, ou elíptica se os desvios- 
padrão forem diferentes. Esses mesmo conceitos podem ser estendidos para 
mais do que duas dimensões, o que é corriqueiro em imagens de S.R., sendo que 
neste caso os contornos se tornam elipsóides em três ou mais dimensões. 
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BANDA 2 


BANDA 1 


Figura 8.7 - Espaço de atributos para as classes A, B e C mostrando na forma de 
contornos a densidade de pixels nos diversos conjuntos de treinamento. O número de 
pixels para cada área de treinamento é, no mínimo, de uma centena. (Modif. De Drury, 
1989) 


Os contornos ao redor de cada classe na Figura 8.7 podem ser entendidos 
como a probabilidade de existir um pixel naquele conjunto de treinamento 
com uma determinada combinação de DNs. Da mesma forma, se as áreas de 
treinamento forem realmente representativas das superfícies que se deseja 
classificar, os mesmos contornos podem ser vistos como a probabilidade de 
qualquer pixel desconhecido pertencer à uma determinada classe na qual 
ele plotar. 

Essas probabilidades representam uma ferramenta de classificação 
poderosa e flexível, através da qual pode-se escolher, por exemplo, classificar 
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apenas os pixels desconhecidos que são bastante semelhantes à média de uma 
classe. Isso é feito escolhendo-se o limite de decisão coincidindo como contorno 
mais próximo da média, cuja distância é normalmente fixada como um desvio 
padrão a partir da média. 

Por outro lado, pode-se julgar necessário classificar os pixels 
desconhecidos que se situam a qualquer distância da média, dentro da área geral 
definida pelo conjunto de treinamento. Neste caso, escolher-se-ia como limite de 
decisão o contorno que engloba 99% dos pixels da área de treinamento. Jogando 
os restantes 1% fora, pode-se compensar, por exemplo, a possibilidade de que 
alguns dos pixels da área de treinamento foram incluídos por engano, podendo 
representar ruído ou pixels contendo um limite entre dois tipos de cobertura. 

Usando esses conceitos, pode-se classificar todos os pixels de uma 
imagem como pertencentes às classes pré-definidas, mesmo que eles tenham 
uma baixíssima probabilidade. A figura 8.8 exemplifica como os contornos de 
probabilidade podem ser estendidos de forma a cobrir todos os pixels da imagem. 

Nota-se pela Figura 8.8 que os pixels que plotam nos pontos 1 e 2 serão 
ambos atribuídos à classe A. Conforme visto anteriormente, o pixel 2 situa-se 
mais próximo, em distância absoluta, da classe B. Pelo método MaxVer, ao se 
ponderar essa distância pelo desvio-padrão das classes A e B, esse pixel possui 
0,1% de probabilidade de pertencer à classe A e 0% de pertencer à classe B. 
Quanto ao pixel 3, ele plota dentro das curvas de contorno de duas classes, B e 
C, mas com uma maior probabilidade de pertencer à classe C (10%, contra 0,1% 
de pertencer à classe B), sendo portanto atribuído à classe C. 

A decisão de atribuir o pixel 3 à classe C exemplifica um outro conceito 
importante na classificação MaxVer, que é o dos limites de decisão entre 
classes contíguas. Esses limites são traçados a partir dos pontos onde 
contornos de igual probabilidade entre duas classes contíguas se cruzam, como 
mostrado na Figura 8.9. 

Em situações reais, o normal é lidar-se com muito mais do que três 
classes, de tal forma que o espaço de atributos normalmente encontrado em 
S.R. é repleto de "nuvens" de pixels e mesmo as área de treinamento muitas 
vezes apresentam recobrimento. Esse recobrimento entre áreas de treinamento 
é causado por que muito dos pixels identificados pelo operador como 
pertencentes a classes diferentes, na verdade plotam com recobrimento no 
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espaço de atributos. Para os métodos de classificação vistos anteriormente, 
essas situações representam obstáculos, o que não ocorre com o MaxVer. A 
Figura 8.10 mostra como é traçado o limite de decisão nestes casos. 


BANDA 2 


BANDA 1 


Figura 8.8 - As curvas de probabilidade das classes A, B e C são estendidas para 
probabilidades menores. Os números atribuídos a cada contorno representam a 
probabilidade, em percentagem, de um pixel desconhecido pertencer a uma dada classe, 
com base nos parâmetros estatísticos das áreas de treinamento. Os pixels 1,2 e 3 são 
discutidos no texto (Modif. de Drury, 1989) 


É importante ressaltar que mesmo o método MaxVer é passível de enganos 
ou imprecisões. Um destes casos é exemplificado na Figura 8.10, na qual alguns 
pixels pertencentes à área de treinamento da classe 2 são atribuídos, pelas 
regras de decisão do método, à uma classe diferente (área sombreada na Figura 
8.10). Tudo o que o MaxVer consegue fazer é tentar minimizar a porcentagem dos 
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pixels classificados erroneamente. 


BANDA 2 


BANDA 1 


| 
255 
Figura 8.9 - Os mesmos contornos da Figura 8.8, agora com os limites de decisão 
(representados pelas linhas espessas na figura acima) superimpostos. Esses limites são 
traçados a partir dos pontos de igual probabilidade para duas ou mais classes. (Modif. de 
Drury, 1989). 


O método MaxVer, bem como os outros métodos de classificação 
supervisionada vistos anteriormente, parte do princípio que o usuário conhece o 
bastante da imagem a ser classificada para poder definir classes que sejam 
representativas. Nos casos em que isto não ocorre, é possível partir de algumas 
premissas razoáveis o suficiente para permitir bons resultados. Porém, é bastante 
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provável que, na maioria dos casos, existam tipos de superfícies ou coberturas 
que o operador não consiga perceber visualmente, devido à diferenças sutis em 
suas propriedades espectrais. Quando isso ocorre, quaisquer das técnicas 
supervisionadas será incapaz de reconhecer essas coberturas como classes. 


Porcentagem de pixels 


Limite de decisão 


Figura 8.10 - Duas distribuições normais, representando os dados de 
duas áreas de treinamento contendo pixels cujos intervalos de Dns se 
superpõem. O limite de decisão neste caso é colocado no ponto em que 
as duas distribuições se cruzam, de tal forma que um pixel desconhecido 
nesta posição teria a mesma probabilidade de pertencer à ambas as 
classes. (Modif. de Drury, 1989) 


Por outro lado, alguns desses métodos, como o MaxVer, se baseiam em 
premissas estatísticas das área de treinamento e, se o usuário por algum motivo 
não consegue definir áreas de treinamento bastante representativas, corre o 
perigo de que a imagem classificada contenha imprecisões sérias. Uma 
abordagem alternativa de classificação é então usada para se tentar evitar esses 
problemas, que é a classificação não-supervisionada. 
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8.6 Classificação Não-Supervisionada 


A classificação não-supervisionada baseia-se no princípio de que o 
computador (na realidade, o software usado) é capaz de identificar por si só as 
classes dentro de um conjunto de dados. Para melhor entender esse conceito, 
faz-se necessário olhar para o espaço de atributos de todos os pixels que 
compõem uma imagem, e não apenas para os pixels que constituem as áreas de 
treinamento. A Figura 8.11 mostra um exemplo desses, onde a densidade de 
ocorrência de pixels é representada por curvas de contorno. 


BANDA 2 


BANDA 1 


Figura 8.11 - Espaço de atributos mostrando a distribuição de densidade de todos os 
pixels em uma imagem, na forma de curvas de contorno. As curvas foram traçadas a 
intervalos de 5 pixels por valor de DN e as maiores concentrações ou agrupamentos foram 


denominadas A, B, ..., H. (Modif. de Drury, 1989) 
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Nota-se no exemplo da Figura 8.11 que o espaço de atributos contém 
vários agrupamentos ou "nuvens" (em inglês, "clusters", os quais são 
caracterizados por regiões de alta densidade de curvas de contorno. No processo 
de classificação não-supervisionada, essas nuvens são automaticamente 
identificadas e usadas como áreas de treinamento para a classificação. 
Esta, por suas vez, pode então se basear em quaisquer dos métodos vistos 
anteriormente. O método mais comum, contudo, é o da máxima verossimilhança. 
Nessa figura, as nuvens foram rotuladas com letras de A a H. As nuvens A, Be 
C correspondem às classes homônimas vistas nos exemplos anteriores, mas 
agora nota-se que existem outros agrupamentos, que foram denominadas D, E, 
F,G,eH. 

Das nuvens de pixels que aparecem na Figura 8.11, nota-se que E é 
menos óbvia dos que as anteriores (A-D), por que o seu valor máximo situa-se 
entre 15 e 20 pixels, enquanto as outras continham máximos acima de 20. Outras 
três nuvens tem o seu valor máximo entre 10 e 15. Destes, F e G estão 
ligeiramente acima do valor de "background" (que situa-se entre 5 e 10) e podem 
na verdade não passar de variações aleatórias. O agrupamento H é isolado dos 
outros e deve ser considerado separadamente; existem na realidade dois picos 
no agrupamento H, mas eles se encontram tão próximos que devem ser tratados 
como um único grupo. 

O primeiro passo na classificação não-supervisionada é a realização de 
uma análise de agrupamento, utilizando para tal técnicas estatísticas padrão. 
Através dessa análise, as nuvens de dados são identificadas no espaço de 
atributos. Uma vez feita essa análise, uma decisão deve ser tomada em relação 
a quais concentrações devem ser tratadas como grupos separados. A melhor 
maneira de fazer isso é aceitar apenas aquelas cujos picos ultrapassam um certo 
limiar. Ou, ainda melhor, deve-se medir a altura dos picos em relação às 
depressões adjacentes, aceitando aqueles picos cuja altura ultrapasse um 
determinado limiar. Para entender isso, é necessário traçar um perfil através do 
gráfico do espaço de atributos, conforme mostrado na Figura 8.12b. A Figura 
8.12a mostra a localização do perfil no espaço de atributos. 

Na Figura 8.12b está marcado um possível valor de limiar para o 
reconhecimento de agrupamentos. Pode-se observar que os únicos 
agrupamentos individualizados com esse limiar são A, B, C e D, uma vez que 
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estes são os únicos a ultrapassarem esse limiar. Mudando-se o limiar para 10, 
todos os agrupamentos passariam a ser reconhecidos. 

Por outro lado, F seria considerado um grupo relevante, quando foi visto 
que ele provavelmente não representa nada significante. H é mostrado como dois 
pequenos picos, ambos aparecendo exatamente acima do limiar de 10, sendo que 
logo abaixo dele os dois se juntam e devem então ser considerados como um 
único grupo. Um outro problema que ocorre quando o limiar é colocado em 10 é 
que os pares de picos B,C e A,D acabam se juntando em dois únicos picos e, a 
menos que o algoritmo sendo usado no software possua um alto grau de 
sofisticação, esses quatro picos seriam agrupados em duas classes. 

Uma alternativa melhor seria então considerar os picos não pelos seus 
valores absolutos, mas sim em relação às depressões vizinhas. No exemplo da 
Figura 8.12, esse critério poderia ser o de aceitar todos os agrupamentos 
cujos picos tiverem 5 ou mais pixels do que as depressões adjacentes. 
Neste caso, todos os picos do exemplo seria aceitos, com exceção de F, sendo 
que o pico G estaria no limite mínimo. 

Esses exemplos mostram que, mesmo nas chamadas classificações não- 
supervisionadas, um certo grau de interação com o usuário é essencial, pelo 
menos na decisão de qual o valor de limiar a ser usado. O limiar mais efetivo 
pode ser decidido com base em listagens fornecidas pelo computador, contendo 
a média para cada classe para diversos limiares, ou através da aplicação de 
classificações tentativas com limiares diversos em pequenas áreas-teste. 

Uma vez decidida qual a estratégia a ser usada no caso do exemplo da 
Figura 8.12, o próximo passo é instruir o sistema para tratar cada agrupamento 
como um conjunto de treinamento, calculando então a distribuição normal 
ajustada para cada um deles. Os pixels fora dos agrupamentos seriam atribuídos 
à classe mais provável, dependendo da sua posição relativa aos limites de 
decisão do MaxVer, da mesma forma como visto anteriormente. 

No caso de terem sido escolhidos os agrupamentos A, B, C,DeH,a 
distribuição das classes no espaço de atributos ficaria conforme mostrado na 
Figura 8.13. Se todos os agrupamentos fossem escolhidos (de A até H), a 
imagem ficaria como mostrada na Figura 8.14. 
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BANDA 2 


BANDA 1 
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b) 


Figura 8.12 - a) Espaço de atributos mostrando a linha pela qual foi traçado o perfil da Figura 
8.12b. (Modif. de Drury, 1989). 

b) Perfil através do espaço de atributos. A linha tracejada é um possível limiar para a 
identificação de agrupamentos mais significantes, determinada pelo valor 15. As 
concentrações de A a H estão assinaladas. (Modif. de Drury, 1989). 


Figura 8.13 - Limites de decisão para classificação MaxVer baseada nos 
agrupamentos A, B, C, d e H da figura 8.11 (modif. de Drury, 1989) 


8.7 Homogeneização de temas em imagens classificadas 


Muitas vezes o resultado da classificação é uma imagem com ruído, 
representado por pixels isolados, ou pequenos grupos de pixels, assinalados a 
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diversas classes, que ocorrem próximos a áreas homogeneamente classificadas. 
Isso é bastante comum ao se fazer classificação em áreas de topografia 
acidentada, uma vez que os efeitos causados por áreas sombreadas e iluminadas 
são extremamente variáveis. Isso ocorre também em áreas em que os pixels 
contém uma mistura de duas ou mais classes. 

Se existem suspeitas de que áreas isoladas desse tipo, com um número 
de pixels abaixo de um certo limite, representam erros de classificação, então é 
possível apagá-los ou absorvê-los em outras áreas adjacentes maiores, 
pertencentes a outras classes. A Figura 8.14 exemplifica um caso desse tipo. 
Esse tipo de "pós-processamento", embora carregue em si uma certa dose de 
risco (pode-se estar desprezando áreas corretamente classificadas), é útil na 
apresentação final do produto de classificação. 


Figura 8.14 - Limites de decisão para classificação MaxVer baseada em todos os 
agrupamentos (A-H) da figura 8.11. (Modif. de Drury, 1989) 
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Outra abordagem comumente utilizada para homegeinização de temas em 
imagens classificadas é a aplicação de filtros de mediana, de tamanhos variáveis. 
Essatécnica é de fácilimplementação, visto que os programas de processamento 
de imagens possuem funções para tal, e bastante eficaz. 


EETEBEZE J 
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c) 


Figura 8.14 - Técnica para remover pequenas áreas que podem ter sido erroneamente 


classificadas (Modif. de Drury, 1989): 
a) Imagem classificada inicial. Tons de cinza representam diferentes classes. 
b) Áreas com menos de um número mínimo de pixels (neste caso, menor do que 6), são 


removidas. 
c) As áreas restantes são expandidas por uma distância especificada (2 pixels neste caso) sobre 


as áreas livres. 
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9.1 Introdução 


A Análise por Principais Componentes (APC), também chamada de 
Transformação por Principais Componentes ou Transformada de Karhunen- 
Loeve, é uma das funções de processamento de imagens mais poderosas na 
manipulação de dados multiespectrais. Ao mesmo tempo, ela é também uma das 
menos compreendidas e, precisamente por isso, talvez uma das mais sub- 
utilizadas das técnicas de processamento digital de imagens. Contudo, com o 
aumento crescente no número de bandas espectrais disponíveis nos modernos 
sensores, a APC vem se tornando cada vez mais relevante na análise espectral 
de imagens multiespecirais. 

Um dos fatores que contribuiu para o uso inadequado dessa técnica no 
processamento de imagens de S.R. está ligado ao próprio histórico da mesma. 
A aplicação da APC ao processamento de imagens iniciou-se no âmbito da 
Engenharia Elétrica, com a finalidade de processar sinais eletrônicos para 
remoção de ruído. Esse enfoque persistiu de certo modo quando a técnica 
passou a ser adotada no processamento de imagens de S.R., causando o 
aparecimento de "receitas" para o seu uso, que acabaram limitando o verdadeiro 
potencial da mesma, como será visto em detalhes mais adiante. Por outro lado, 
os conceitos matemáticos envolvidos na APC são consideravelmente complexos, 
o que contribuiu para que os princípios básicos por trás da técnica não fossem 
adequadamente compreendidos pelos usuários do processamento digital de 
imagens. 

Outra característica da APC é que seus resultados são de difícil 
generalização para determinados tipos de aplicações. Na realidade, esses 
resultados são extremamente dependentes das características espectrais da cena 
sendo processada, não devendo ser transportados para outras situações. 

A melhor maneira de se entender os conceitos envolvidos na APC, sem 
necessariamente aprofundar-se na definição e nos detalhes matemáticos da téc- 
nica, é usando o conceito de espaço de atributos, visto anteriormente quando 
se discutiu operações aritméticas e classificação. 

Como já comentado anteriormente, as imagens produzidas por sensores 
remotos do tipos "scanners" possuem um alto grau de correlação entre as suas 
bandas multiespectrais, de tal forma que seus espaços de atributos são 
relativamente estreitos. A principal função da APC é determinar a extensão 
dessa correlação e, através de uma transformação matemática apropriada, 
removê-la. Um conjunto de N imagens de entrada vai produzir, quando 
processadas através da APC, um outro conjunto de N imagens de saída com 
nenhuma correlação entre si. 

A Análise por Principais Componentes é apropriada no tratamento de 
imagens produzidas por sensores com um alto número de bandas espectrais. Ela 
é também de grande utilidade na análise de dados comumente utilizados em 
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geologia, tais como radar, geoquímica ou geofísica, em conjunto com imagens 
multiespectrais. 


9.2 Correlação de imagens 


Antes de iniciar a discussão da APC propriamente dita, convém analisar 
a razão e as implicações da correlação entre as bandas espectrais de uma 
imagem. Duas imagens são ditas correlacionadas quando, dada a 
intensidade de um determinado pixel em uma delas, pode-se deduzir com 
razoável aproximação a intensidade do pixel correspondente na outra 
imagem. Se as duas imagens são absolutamente idênticas, as imagens são ditas 
100% correlacionadas. Se uma delas é o negativo da outra, essa dedução 
também pode ser feito precisamente, mas neste caso as imagens são ditas serem 
-100% correlacionadas. 

Em um gráfico de espaço de atributos, a correlação entre imagens se 
mostra como uma distribuição de pontos ao longo da reta de direção próxima à 
diagonal principal. Em um caso bidimensional, duas imagens perfeitamente 
correlacionadas vão ter seu espaço de atributos representado por uma linha reta, 
inclinada a 45º, como mostrado na Figura 9.1a. O caso em que a correlação é - 
100% também é representado por uma reta, mas agora com uma inclinação 
negativa. Já um exemplo em que duas imagens apresentam uma correlação 
parcial é mostrado na Figura 9.1, em que a distribuição tem uma forma elipsoidal 
ao longo da reta, mas agora com espalhamento finito. 


Correlação = +100% 


Imagem B 


Correlação = -100% 


Imagem A 


a) Duas imagens (A, B) correlacionadas 


137 


Baixado por Daiane Cardoso Lopes (daiane.lopes(Oseducam.pro.br) 


A. P. Crósia, Processamento Digital de Imagens de Sensoriamento Remoto 1992 


Imagem B 


Imagem A 


b) Duas imagens com correlação menor do que 100% 


Figura 9.1 - Correlação em um espaço de atributos 
bidimensional 


Comparando-se esses dois casos pode-se notar como muda o processo 
de predição do valor da intensidade do pixel de uma imagem a partir do 
valor da outra. No caso da Figura 9.1a, tomado um pixel da imagem A, acha-se 
um único pixel correspondente na imagem B. No caso da Figura 9.1b, acha-se um 
intervalo de valores de intensidade na imagem B correspondendo a um único 
pixel da imagem A; esse intervalo será inversamente proporcional à correlação 
entre as imagens. 

A Figura 9.2 mostra dois exemplos de espaços de atributos para imagens 
totalmente não-correlacionadas. O primeiro deles é uma extensão da Figura 9.1b, 
mostrando uma distribuição circular de pontos, onde o processo de predição não 
funciona (para um ponto da imagem A, é impossível predizer qual o ponto 
correspondente em B). A Figura 9.2b mostra uma distribuição semelhante à da 
Figura 9.2a, mas com a imagem B tendo sofrido uma compressão em seu 
contraste, de tal forma que o intervalo total de intensidades foi consideravelmente 
reduzido. Da mesma forma, o processo de predição neste caso é também 
impossível. 

Como já mencionado antes, as causas da existência de correlação 
podem ser várias, as mais importantes sendo o sombreamento topográfico e a 
relação entre o espectro de reflectância dos materiais superficiais e as bandas 
espectrais do sensor. Uma vez que praticamente todos os sensores 
multiespectrais dependem da iluminação solar, essa correlação vai quase sempre 
existir, com o sombreamento tendendo a afetar todas as bandas da mesma 
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maneira. O sombreamento, embora útil para a percepção dos detalhes texturais 
de uma imagem, pode obscurecer feições espectrais de interesse. Como 
exemplo, pode-se mencionar a dificuldade de classificar um determinado tipo de 
superfície localizada em uma área de sombra, quando a área de treinamento 
usada encontrava-se iluminada. Existem duas exceções nessa questão do 
sombreamento afetando igualmente todas as bandas: a primeira diz respeito às 
imagens termais (a banda 6 do TM, por exemplo) que, por representarem 
energia emitida, e não a refletida pelo sol, possuem muito menos correlação com 
as outras bandas refletidas. Outro caso são as bandas de comprimento de 
onda na faixa da radiação visível de baixo comprimento de onda, como a 
banda 1 do TM, que, por sofrerem intensamente os efeitos de espalhamento 
atmosférico, os quais não afetam as outras bandas da mesma forma, geralmente 
apresentam uma menor correlação com as outras bandas refletidas. 


Ambas as imagens possuem 
igual contraste 


Imagem A 


Imagem B possui menos 
contraste do que imagem A 


Imagem A 


b) 
Figura 9.2 - Espaço de atributos de imangens não-correlacionadas 
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A correlação entre bandas multiespectrais, quaisquer que sejam suas 
causas, vai sempre obscurecer diferenças sutis entre reflectâncias dos materiais 
superficiais, dificultando a sua identificação e, consequentemente, a sua 
separação. Uma vez que correlação significa que uma imagem pode ser (mais ou 
menos) inferida a partir de outra, isto também implica que uma certa redundância 
dos dados ou, visto de um outro angulo, um certo desperdício na manipulação, 
processamento e armazenamento de dados. Uma questão que se coloca neste 
ponto é: "Se uma grande proporção de cada banda espectral é composta por 
informação redundante, por que não extrair essa informação comum, 
concentrando-a em uma única imagem ao invés de replicá-la várias vezes?" 
O que restar após a extração da informação comum pode então ser distribuído em 
novas imagens. Esta noção forma a base conceitual da APC. 


9.3 Variância e covariância de imagens 


Para poder analisar as correlações entre as várias bandas de uma 
imagem, faz-se necessário alguma forma de representação matemática. Essa 
representação pode ser feita em função de alguns parâmetros, tratados a seguir. 

Considerando o espaço de atributos bidimensional das duas imagens A e 
B vistas nas duas figuras anteriores, o parâmetro mais simples de especificar é 
a posição do centróide da distribuição. A Figura 9.3 mostra a posição do 
centróide, que representa o centro de gravidade da distribuição (e não o centro 
geométrico), significando o ponto em que um hipotético "pixel de intensidade 
média" da imagem seria localizado. 

Uma vez que o centróide é conhecido, o tamanho da distribuição necessita 
ser especificado. Isso é feito através do cálculo do espalhamento ao longo de 
cada eixo, que recebe o nome de variância. A variância é definida pelo quadrado 
do desvio-padrão do histograma de intensidades para cada banda e dá a medida 
do contraste de cada banda espectral. 
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Centróide 


uA 


Imagem A 


B = Intensidade médias das imagens A, B 
, B = desvios-padrão das imagens A, B 


o) = variancia 


( 
Figura 9.3 - Parâmetros estatísticos básicos do espaço de atributos. 


Por último, a correlação entre cada par de bandas da imagem deve ser 
especificada, usando-se o parâmetro chamado de covariância. A covariância é 
uma grandeza que relaciona duas variâncias específicas e descreve o quanto a 
distribuição é espalhada ao longo da direção diagonal e, portanto, o grau de 
correlação existente entre duas bandas. Em outras palavras, ela dá a medida do 
quanto de informação contida em um par de bandas é comum a ambas. A 
covariância pode tanto ser positiva, e neste caso é dito que os dados são 
positivamente correlacionados, como negativa, quando eles são negativamente 
correlacionados. 

Na APC, é comum definir a covariância em termos do coeficiente de 
correlação. Esse coeficiente é calculado através da normalização da covariância, 
para considerar o espalhamento de contraste em cada banda individualmente. 
Isso é feito através da divisão da covariância pelo produto dos dois desvios- 
padrão (A,B). 

As fórmulas matemáticas para o cálculo desses parâmetros requerem a 
inspeção de cada pixel de cada banda da imagem a ser processada, motivo pelo 
qual a APC é um processo bastante demorado em termos computacionais. Por 
exemplo, para uma imagem TM com 7 bandas, todos os aproximadamente 6 
milhões de pixels são usados para se calcular 7 médias, 7 variâncias e 21 
covariâncias! 
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9.4 A Transformação por Principais Componentes 


A principal tarefa executada pela APC pode ser resumida da seguinte 
forma: dadas Nimagens brutas (sem qualquer outro tipo de processamento), são 
analisadas as correlações entre elas e produzido um novo conjunto de N novas 
imagens, com nenhuma correlação entre si. De modo geral, esse novo conjunto 
de imagens terá as seguintes características: a primeira delas, cnamada de 1º 
Principal Componente, ou PC1, irá conter a informação que é comum a todas as 
N bandas originais; a 2º PC irá conter a feição espectral mais significante do 
conjunto e assim sucessivamente as PCs de ordem mais alta irão conter feições 
espectrais cada vez menos significantes, até a última PC, que concentrará então 
a informação que sobrar. 

Para se entender como funciona esse agrupamento de dados baseados 
na correlação entre bandas, é necessário examinar uma representação gráfica 
da transformação por principais componentes. A Figura 9.4 mostra um espaço de 
atributos bidimensional (notar que isto é uma simplificação de uma situação real, 
onde o espaço de atributos terá tantas dimensões quantos forem as bandas 
espectrais consideradas!), com o centróide assinalado. Deve-se ser enfatizado 
que a tendência alongada da distribuição é causada pela correlação entre as 
duas imagens e que o espalhamento em volta da diagonal é originada pelas 
diferenças espectrais entre as duas imagens (quanto maior a diferença, mais 
longe da diagonal estarão os pontos da distribuição). 


,” Eixo da PCI 


centróide 


N 


Eixo da PC2 


Imagem A 


a) Determinação bidimensional dos eixos das PCs 
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Eixo PC1 transladado 


b) Rotação dos eixos das PCs 


Figura 9.4 - Transformação por Principais Componentes 


A transformação por principais componentes funciona da seguinte forma: 
primeiramente, determina-se a direção relativa ao centróide que possui a 
máxima variância ou espalhamento, atribuindo-se à ela o eixo da 1? PC. Na 
Figura 9.4a essa direção é representada pelo eixo principal da elipse; essa 
direção descreve a correlação entre as imagens A e B. Em seguida, determina- 
se a direção relativa ao centróide que possui a segunda maior variância ou 
espalhamento, com a condição de que ela deva ser ortogonal em relação à 
primeira direção, atribuindo-se à esta segunda direção o eixo da 2? PC. É 
claro que, neste exemplo bidimensional, não há nenhuma outra possibilidade para 
se colocar o eixo da 2? PC, devido à restrição da ortogonalidade. Porém, em um 
caso real, usando por exemplo uma imagem TM com 6 bandas, existiriam pelo 
menos 5 direções alternativas para o eixo da 2º PC após se ter determinado o 
eixo da 12 PC. Esse processo é então repetido tantas vezes quanto for o número 
de bandas da imagem, até que todos os eixos tenham sido determinados. Por 
último, rotaciona-se a distribuição do espaço de atributos em volta do 
centróide, até que cada uma das direções encontradas fique paralela a um 
dos eixos originais. Essa distribuição rotacionada é mostrada na Figura 9.4b e 
representa as duas novas Principais Componentes calculadas a partir das 
imagens A e B. 

A distribuição mostrada na Figura 9.4b é equivalente aquela da Figura 
9.2, podendo-se observar que não existe correlação alguma. No exemplo da 
Figura 9.4b, a correlação foi propositalmente removida pela rotação dos eixos, 
não havendo nenhuma tendenciosidade diagonal na distribuição. 
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Na prática, esse processo, acima descrito de maneira gráfica, é 
implementado algebricamente, usando-se os coeficientes de correlação ou as 
covariâncias para se determinar um conjunto de quantidades conhecidas por 
auto-valores (eigenvalues, em inglês). Os auto-valores representam o 
comprimento dos eixos das PCs de uma imagem e são medidos em unidades 
de variância. 

Associados com cada auto-valor, existe um outro conjunto de quantidades, 
que é na verdade um conjunto de coordenadas, chamados de auto-vetores 
(eigenvectors), que representam as direções dos eixos das PCs. Os auto- 
vetores servem com fatores de ponderação que definem a contribuição de cada 
banda original para uma PC, numa combinação aditiva e linear que tem a 
seguinte forma: 


PC1 = (B,*e,)+(B,“e,)+.... + (Bn * en) 


PCN = (B, * e1) + (B2 * @n2) + .... + (Bn * enn) 
onde PC1,....PCN são as principais componentes, B1,...,B„ são as bandas 
originais e €,43-..€, n/€n,13---:en,n SÃO OS auto-vetores. 


9.5 Aumento de Contraste e Composições Coloridas de Principais 
Componentes 


Ao se observar a Figura 9.4b, nota-se que o espaço de atributos das 
imagens PC não é muito grande. Em particular, a segunda PC possui muito 
menos contraste do que a primeira, significando que ela possui muito menos 
informação. A quantidade de informação em cada PC é fornecida pelo respectivo 
auto-vetor. Isso é comum em APC de imagens multiespectrais, onde cada 
sucessiva PC possui menos informação do que suas predecessoras. Deve 
ser enfatizado que isso não quer dizer que essa informação seja qualitativamente 
menos importante, mas apenas que em termos quantitativos o conteúdo em 
informação decresce para as últimas PCs. Por outro lado, se as imagens PCs 
forem submetidas a um aumento de contraste, no sentido de se obter uma mesma 
variância para a primeira e a segunda PCs, o espaço de atributos resultante vai 
ser consideravelmente ampliado. Considerando o exemplo bi-dimensional da 
Figura 9.4b, obtém-se a distribuição mostrada na Figura 9.5. 

Neste caso, foi aplicado um aumento de contraste independente nas duas 
PCs, o que aumentou seus espalhamentos ao longo dos dois eixos, tornando a 
distribuição final um círculo, e não mais uma elipse. Dessa forma, imagens PCs 
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com aumento de contraste utilizam muito melhor o espaço de atributos, permitindo 
uma melhor diferenciação dos materiais superficiais, uma vez que as nuvens de 
pontos que os representam irão plotar mais separadas nesse espaço. 
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Eixo PCI transladado 


Figura 9.5 - Aumento de contraste aplicado em PCs para equalização da 
variância. 


Deve ser notado que não é possível se obter o formato circular mostrado 
na figura 9.5 utilizando-se apenas técnicas de aumento de contraste em imagens 
originais, pois nesse caso tende-se apenas a "esticar" a distribuição elíptica ao 
longo dos eixos originais. 

Imagens PCs podem ser combinadas em cores como quaisquer outras. A 
diferença é que a distribuição de cores em composições coloridas de PCs é a 
melhor possível, uma vez que não há correlação entre as imagens. Desse modo, 
uma composição colorida desse tipo praticamente não possui tons de cinza (o 
que indicaria correlação) mas apenas cores espectrais puras e intensamente 
saturadas. 


9.6 Interpretação de imagens PCs 

No tocante à interpretação de imagens Pcs, trata-se de uma tarefa 
razoavelmente complexa. O resultado da APC depende fortemente da forma 
exata da distribuição do espaço de atributos. Portanto, não há "receitas" fixas 
para a interpretação de Pcs e cada caso deve ser considerado separadamente. 
Uma das únicas regras que pode ser adotada é que a 1º PC irá sempre conter o 
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albedo mais o sombreamento topográfico de uma cena de satélite, ou seja, é uma 
imagem muito semelhante à uma vista "pancromática" da cena. Todas as demais 
Pcs são completamente desprovidas de informação topográfica, devido à 
ausência do sombreamento. 

Uma maneira de se compreender como as Pcs são formadas é 
examinando-se cuidadosamente a matriz de auto-vetores, para entender a 
contribuição de cada banda original na formação de cada uma das Pcs. Para 
tornar mais fácil a percepção dessas contribuições, deve-se transformar os auto- 
vetores em porcentagens, o que não modifica o resultado uma vez as Pcs são 
uma combinação aditiva linear das bandas originais. Uma vez calculadas as 
porcentagens e sabendo se o sinal de cada coeficiente do auto-vetor é positivo 
ou negativo, pode-se comparar comas curvas espectrais de materiais conhecidos 
(por exemplo, vegetação, água, diferentes tipos de solos e rochas, etc), 
determinando-se assim com um grau razoável de certeza em qual(is) PC(s) a 
informação espectral desejada irá ser concentrada. 

Um outro ponto sobre Pcs é a questão da concentração de ruído. Já foi 
visto que o ruído, inerente à maioria dos sensores, representa informação não- 
correlacionada entre bandas. Assim, o ruído irá sempre ser extraído do conjunto 
de bandas multiespectrais pela APC e concentrado nas últimas PCs. Por esse 
motivo, uma das recomendações comuns em processamento de imagens 
multiespectrais é que se descarte as últimas PCs de um conjunto, para se livrar 
do ruído que irá se concentrar nelas. Assim, é comum encontrar, por exemplo, 
aplicações usando 3 das 4 primeiras PCs de uma imagem TM (que tem 6 bandas 
refletidas e, portanto, 6 PCs). O problema nesse caso é que, embora do ponto de 
vista quantitativo a porcentagem de informação nas duas últimas Pcs seja muito 
inferior a das anteriores, do ponto de vista qualitativo essa pequena porcentagem 
pode corresponder justamente à informação de interesse do usuário! Esse é o 
caso, por exemplo, de feições espectrais relacionadas a determinados minerais 
indicativos da presença de jazidas, que, por se tratar de feições espectrais muito 
específicas, fica normalmente concentrado nas 2 ou 3 últimas PCs! 


9.7 Modificações da APC 
O processo da APC pode ser modificado de algumas formas, no sentido 
de melhorar sua aplicação em alguns casos específicos. Existem duas 


modificações da APC que são comumente utilizadas. A primeira delas é 
denominada Análise Canônica e a segunda Realce por Decorrrelação. 
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9.7.1 Análise Canônica 


Em termos conceituais, a Análise Canônica representa uma mistura de 
classificação e principais componentes, funcionando da seguinte maneira: se 
numa cena sabe-se que existem determinados tipos de coberturas superficiais e 
se a posição das nuvens de pontos que os representam no espaço de atributos 
é mais ou menos conhecida, então a APC pode ser direcionada de tal forma 
que tudo que não pertencer a esses tipos de coberturas será ignorado 
quando da aquisição dos parâmetros estatísticos. Esse direcionamento é feito 
através da determinação das áreas nas quais se quer que a estatística seja 
considerada, usando a mesma sistemática de definição de "áreas de treinamento" 
empregada na classificação. No espaço de atributos esse procedimento vai 
remover as nuvens correspondentes aos tipos de cobertura sem interesse, 
deixando apenas as nuvens dos materiais superficiais de interesse. Em uma 
situação em que há uma superposição, no espaço de atributos, entre as nuvens 
dos tipos de cobertura de interesse com outras nuvens sem interesse, esse 
processo é bastante eficaz. 

Um exemplo de situação em que o emprego da Análise Canônica pode ser 
útil é quando se tem uma área com manchas de cobertura vegetal e se quer 
processar a imagem para realce de feições geológicas ou de solos, que 
normalmente seriam obscurecidas pela presença da vegetação. Neste caso, pode 
especificar como "área de treinamento” para o cálculo dos parâmetros estatísticos 
(matriz de covariância) da APC as regiões onde as rochas (ou solos) são bem 
expostos, ignorando as áreas com cobertura vegetal. 

Assim como na classificação, na Análise Canônica é essencial que sejam 
usadas áreas representativas, e grandes o suficiente, para permitir que 
parâmetros estatísticos confiáveis seja usados. Por outro lado, as áreas que 
forem desprezadas na aquisição da estatística devem ser consideradas com 
cautela (ou totalmente desconsideradas!) nas imagens resultantes da Análise 
Canônica, pois irão conter informação distorcida. 


9.7.2 Realce por Decorrelação 


Um dos maiores problemas associados com as imagens produzidas pela 
APC diz respeito à dificuldade em interpretar os resultados, principalmente 
quando são usadas composições coloridas de três PCs. O motivo dessa 
dificuldade é relacionado ao significado das cores presentes numa composição 
colorida desse tipo. Usando-se bandas originais TM, por exemplo, é fácil de se 
prever o significado das cores em uma composição colorida, através da 
associação dessas bandas e das cores usadas em cada uma delas (RGB) com 
a assinatura espectral do material em questão. Assim, por exemplo, usando-se 
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a banda TM4 em vermelho, sabe-se que toda a biomassa verde aparecerá em 
vermelho, a banda TM3 em verde mostrará solos vermelhos na cor verde e assim 
por diante. Porém, uma vez que a os novos eixos das PCs são rotacionados, essa 
associação entre bandas originais e assinaturas espectrais se torna 
extremamente complexa (lembre-se que cada PC é uma adição ponderada de 
todas as bandas que compõem a imagem, algumas multiplicadas por -1!). Dessa 
forma, seria útil se, após a aplicação da APC e do aumento de contraste das 
novas imagens PCs, fosse possível restaurar as relações de cores originais, para 
efeito de interpretação. É precisamente essa a base teórica da técnica de Realce 
por Decorrelação (em inglês, "Decorrelation Stretch”). 

No Realce por Decorrelação, segue-se todos os passos usados em APC, 
até a fase final em que as imagens PCs temo seu contraste aumentado, para que 
tenham as mesmas variâncias. Neste ponto a distribuição no espaço de atributos 
assemelha-se a um círculo, conforme visto na Figura 9.5 para o caso 
bidimensional. Uma vez que um círculo possui a mesma forma quando visto de 
qualquer angulo, ele pode ser rotacionado ao redor do seu centro sem que 
o formato da distribuição seja alterado e, portanto, sem que se mude a 
correlação entre as PCs representadas nesse espaço de atributos. Se esse 
círculo fosse submetido à rotação inversa à da APC original, as imagens 
resultantes teriam cores similares às das bandas originais. A única diferença é 
que o espaço de atributos será agora esférico e as imagens terão um intervalo de 
cores muito maior. A Figura 9.6 mostra, em um espaço bidimensional, como 
funciona essa técnica. 


Eixo PC1 


rotação 


“Eixo PC2 


Imagem A Imagem A 


Figura 9.6 - No Realce por Decorrelação, após o aumento de contraste, a distribuição circular 
sofre a rotação inversa à sofrida pelos eixos das PCs, para que volte a ficar orientada segundo 
o sistema de coordenadas das imagens originais. 
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O Realce por Decorrelação, visa principalmente o realce da distribuição de 
cores, através da eliminação da correlação entre bandas. Por se tratar de uma 
técnica para realce de cores, ela só faz sentido em ser aplicada a tripletes de 
bandas, ao contrário da Análise por Principais Componentes, que normalmente 
é aplicada a todas as bandas de uma imagem. Portanto, o primeiro passo no 
Realce por Decorrelação é selecionar o triplete desejado, para depois seguir os 
passos indicados. 

Um último comentário sobre o Realce por Decorrelação se refere à sua 
implementação matemática. Uma vez obtida a matriz de auto-vetores do triplete 
de bandas selecionado para se aplicar essa técnica, a única diferença em 
relação à APC é que o Realce por Decorrelação se utiliza da matriz 
transposta de auto-vetores, isto é, as linhas passam a ser colunas e as colunas 
passam a ser linhas. Uma vez transposta a matriz, calcula-se cada banda 
decorrelacionada da mesma forma que as Pcs, ou seja, multiplicando-se cada PC 
pelos respectivos auto-vetores. Essa transposição da matriz de auto-vetores 
representa a rotação inversa dos eixos da PCs. 
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10.1 Introdução 


Imagens geradas por sensores remotos, sejam elas fotografias aéreas ou 
imagens de satélite, são sujeitas a uma série de distorções espaciais, não 
possuindo portanto precisão cartográfica quanto ao posicionamento dos objetos, 
superfícies ou fenômenos nelas representados. Todavia, a informação extraída de 
imagens de sensoriamento remoto necessita muitas vezes ser integrada com outros 
tipos de informação, representados na forma de mapas. Esse tipo de uso é muito 
comum quando se trabalha com Sistemas Geográficos Informação (SGls), nos quais 
as imagens de sensoriamento remoto são uma das principais fontes de dados. 
Outras vezes, os dados contidos em uma imagem de satélite precisam ser 
apresentados ao usuário na forma de um "mapa", com um grid geográfico de 
referência lançado sobre a mesma. 

Um mapa pode ser definido como: "... uma representação gráfica, em 
uma superfície plana, da superfície da Terra, ou parte dela, mostrando suas 
feições geográficas e superficiais. Estas são posicionadas de acordo com 
controles geodéticos, grids, projeções e escalas previamente definidos”. 
Uma projeção cartográfica é uma maneira de se representar a superfície curva da 
Terra sobre uma folha plana de papel (o mapa). Muitos e diferentes tipos de 
projeções cartográficas são utilizados para tal. Cada um desses tipos representa 
uma tentativa de preservar alguma propriedade da área mapeada, como a 
representação uniforme de áreas, formas ou distâncias. Apenas uma dessas 
propriedades pode ser corretamente representada em um mesmo tipo de projeção, 
ao passo que as outras duas podem no máximo ter sua distorções minimizadas. No 
Brasil, o sistema de projeção cartográfica UTM (Universal Transversa de Mercator) 
é utilizado como padrão para mapas, sendo que nele as distâncias são 
corretamente representadas. 

Para que a precisão cartográfica seja introduzida em imagens de 
sensoriamento remoto, faz-se necessário que essas imagens digitais sejam 
corrigidas, segundo algum sistema de coordenadas. A transformação de uma 
imagem de modo que ela assuma as propriedades de escala e de projeção de um 
mapa é chamada de correção geométrica. Esse tipo de correção pode ser 
executado em um sistema de processamento digital de imagens. 

Muitas vezes existe a necessidade de se combinar duas imagens diferentes 
de uma mesma área. Esse é o caso, por exemplo, de imagens multi-temporais de 
satélite, no qual se deseja comparar mudanças ocorridas em uma determinada 
área, em diferentes épocas. Uma vez que a plataforma (satélite) que carrega o 
sensor é afetada por movimentos aleatórios, duas imagens obtidas em diferentes 
épocas jamais terão uma cobertura equivalente no terreno, ainda que o sensor e o 
satélite sejam os mesmos. Para que duas imagens seja perfeitamente coincidentes 
no espaço é necessário que sofram um tipo de transformação espacial conhecido 
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por registro. O registro é então o ajuste do sistema de coordenadas de uma 
imagem (dado em pixels/linhas) ao sistema equivalente de uma outra imagem, 
cobrindo a mesma área. Outro exemplo comum de necessidade do registro é na 
integração de imagens de diferentes sensores (SPOT e TM, por exemplo) sobre 
uma mesma área. Um outro tipo de exemplo no qual o registro entre imagens é 
usado é o da confecção de mosaicos a partir de imagens vizinhas com cobertura 
parcial. 

A correção geométrica e o registro entre imagens de sensoriamento remoto 
serão tratados neste capítulo. 


10.2 Fontes de distorção em imagens orbitais 


Para melhor entender essa questão da distorção, faz-se necessário um 
exame das fontes de distorção em imagens obtidas por sensores remotos orbitais. 
Dentre as fontes cujas distorções são passíveis de correção, chamadas distorções 
não-sistemáticas, as principais são: rotação da Terra e instabilidade da plataforma. 
Ainstabilidade da plataforma pode ser separada em 5 componentes, que atuam em 
conjunto e de maneira não-uniforme, produzindo distorções. Essas componentes 
são: variação na altitude, na velocidade e nos três eixos de rotação do satélite, 
conhecidos por "roll", "pitch"e "yaw". A figura 10.1 mostra o efeito desses seis tipos 
de distorções em uma imagem de satélite. 


O processo de correção geométrica envolve as seguintes etapas: 


i) determinação da relação entre o sistema de coordenadas do mapa 
e da imagem; 

ii ) estabelecimento de um conjunto de pontos definindo os centros dos 
pixels na imagem corrigida, conjunto esse definindo um grid com as 
propriedades cartográficas do mapa; 

iii) cálculo dos valores de intensidade dos pixels na imagem corrigida, 
por interpolação das intensidades dos pixels da imagem original. 
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Variacao do rol Variacao do yaw 


Figura 10.1 - Efeito das distorções não-sistemáticas em imagens orbitais. Linhas cheias 
indicam as imagens distorcidas e linhas tracejadas as mesmas imagens restauradas. (Modif. 
de Schowengerdt, 1983) 


10.3 Correção geométrica 


Arelação entre os dois sistemas de coordenadas (mapa e imagem) pode ser 
calculada de duas formas. A primeira delas é através do conhecimento exato dos 
parâmetros geométricos da órbita do satélite e de outras variáveis, também 
chamada de modelo de geometria orbital. A segunda forma de se calcular a 
relação entre os dois sistemas de coordenadas, e também a mais utilizada, é 
através da definição de pontos de controle no terreno, que tem de ser 
reconhecíveis tanto no mapa como na imagem. 

Como será visto a seguir, esses dois tipos de correção geométrica são 
usados de forma complementar, no ajuste de imagens orbitais. 


10.3.1 Transformação baseada no modelo de geometria orbital 


A transformação relativa ao modelo de geometria orbital se baseia no 
conhecimento das características da órbita do satélite, da rotação da Terra e no 
fator de amostragem do sensor. O grau de precisão dessa técnica é relativamente 
baixo, sendo o erro médio estimado para esse método da ordem de 2%. 
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Os tipos de distorção eliminados por essa transformação são mudanças de 
escala, correção do "skew" (o angulo de inclinação entre a projeção da órbita em 
relação ao eixo norte-sul da Terra) e correção do efeito de rotação da Terra durante 
a aquisição da imagem (a título de exemplo, o deslocamento relativo entre a 
primeira e a última linha de uma imagem MSS em uma latitude de 50º é mais de 8 
km). 

A transformação para correção dessas distorções é efetuada nas fitas- 
mestre, antes da gravação das fitas CCTs para distribuição aos usuários. No Brasil, 
o INPE executa esse tipo de correção rotineiramente em todos os seus produtos, 
não havendo portanto necessidade de se fazê-lo posteriormente. 

As informações sobre os parâmetros orbitais do sensor são fornecidas nas 
fitas CCTs, contidas geralmente em um arquivo específico, situado antes da 
imagem. 


10.3.2 Transformação baseada em pontos de controle no terreno 


Uma vez que a precisão fornecida pela transformação baseada no modelo 
de geometria orbital é reduzida, existe muitas vezes a necessidade de refinar a 
correção geométrica de uma imagem. Nestes casos, usa-se a transformação 
baseada em pontos de controle no terreno, que permite uma precisão bem mais 
elevada. É claro que essa maior precisão será uma função direta da precisão na 
identificação e posicionamento dos pontos de controle, o que é feito geralmente de 
forma interativa pelo usuário. 

A primeira condição para se aplicar essa transformação é a existência de 
mapa planimétrico ou plani-altimétrico confiável e em uma escala adequadana área 
em questão, visto que os pontos de controle (GCPs, de "ground control points”) 
terão que ser precisamente identificados em ambos, imagem e mapa. Em áreas 
onde não existem mapas, a alternativa é medir precisamente no terreno a posição 
geográfica de alguns pontos identificáveis nas imagens, usando por exemplo GPS's 
(Global Positioning Systems), o que por outro lado representa um custo elevado. 

O conceito por trás desse método é o de estabelecer as diferenças de 
posicionamento de alguns pontos na imagem e no mapa. A partir dessas 
diferenças, a natureza da distorção presente na imagem pode ser estimada e uma 
transformação adequada pode ser computada, no sentido de corrigir a imagem. 

Os GCPs são feições bem definidas, geralmente de grande contraste 
espectral em relação aos seus arredores na imagem e facilmente reconhecíveis, 
que podem ser precisamente localizados tanto no mapa quanto na imagem. 
Exemplos de tipos de GCPs mais comuns são intersecção de estradas, limites de 
feições agrícolas (campos semeados), intersecção de drenagem, pistas de 
aeroportos e outros. Esses GCPs são identificados e posicionados de maneira 
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interativa na imagem, na forma de coordenadas em linha e coluna, usando-se um 
sistema de processamento de imagem (geralmente com alguma função de "zoom" 
para maior precisão). As coordenadas geográficas dos mesmos GCPs são obtidas 
a partir dos mapas (com o uso de mesa digitalizadora ou, quando estas não forem 
disponíveis, com uma simples régua), ou do uso de GPS, e fornecidas ao sistema 
de processamento de imagens. 

O procedimento usualmente adotado envolve a identificação de, no mínimo, 
de 6 a 10 pontos de controle em uma imagem de 1.000 x 1.000 pixels (para 
imagens maiores o número de pontos deve também ser maior) e no mapa 
correspondente. A transformação de coordenadas é então modelada usando-se um 
único polinômio linear de baixa ordem (geralmente de 1º ordem), obtido através de 
um ajuste pelo método dos mínimos quadrados em relação aos GCPs (Figura 10.2). 
Essa transformação é chamada de transformação afim e irá corrigir quaisquer 
distorções de escala, deslocamento, rotação ou "skew" existente entre a imagem 
e o mapa. 

Idealmente, o programa a ser usado parao cálculo dessa transformação afim 
deve oferecer a opção de, antes de ser aplicada a transformação, comparar os 
erros obtidos nos ajustes entre os GCPs e os seus equivalentes na imagem e, caso 
algum deles apresente individualmente um erro considerado alto, descartá-lo. A 
margem de erro recomendável é por volta de +1 pixel. Após uma análise dos erros 
para cada GCP individualmente, aplica-se a transformação na imagem original, 
produzindo-se então uma nova imagem, corrigida segundo a projeção cartográfica 
do mapa a partir do qualforam obtidos os GCPs. Para se obter essa nova imagem, 
é usado o processo de reamostragem por interpolação, exposto a seguir. 


10.4 Reamostragem por interpolação 

O processo de corrigir as distorções de uma imagem através de GCPs 
resulta na produção de uma nova imagem. Os pixels dessa nova imagem, por força 
do processo de correção, não correspondem espacialmente aos pixels da imagem 


original, o que implica em um problema: qual o DN a ser atribuído a esses novos 
pixels? A Figura 10.3 ilustra graficamente essa questão. 
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Figura 10.2 - Modelo de distorção usando pontos de controle no terreno. Este 
exemplo representa uma aproximação usando o método dos mínimos quadrados e um 
polinômio linear. 


Para se determinar o valor dos pixels do grid corrigido, utiliza-se o método 
de interpolação de valores de DNS. A nova imagem é então reamostrada 
inteiramente, sendo o valor de DN de cada um de seus pixels determinado com 
base na interpolação dos valores de DN dos pixels mais próximos da imagem 
original. Existem vários métodos de interpolação, com diferentes precisões. Os 
métodos mais comuns são: vizinho próximo, bilinear e convolução cúbica. 

Pelo método do vizinho próximo, o novo valor do pixel hachuriado da 
Figura 10.3 seria iguala a, uma vez que este é o valor mais próximo de seu centro. 
Este é o método mais simples dos três, tendo uma vantagem, a rapidez de 
computação, e uma desvantagem, o fato de que valores de DNs se repetem, 
formando uma imagem visualmente com pouca estética. 
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Figura 10.3 - O grid de linhas tracejadas acima representa uma imagem original com 
distorções, a ser corrigida segundo um novo grid geometricamente preciso, representado em 
linhas cheias. Os símbolos a, be g representam valores de DNs da imagem original. O novo 
valor de DN do pixel hachuriado será definido com base na interpolação dos valores dos pixel 
mais próximos da imagem original. (Modif. de Curran, 1986). 


O método de interpolação bilinear toma por base os valores de DNs dos 
quatro vizinhos mais próximos ao centro do novo pixel, calculando uma média 
ponderada pelas distâncias dos centros desses quatro vizinhos ao centro do novo 
pixel. Na Figura 10.3, os valores a e B seriam considerados no cálculo. Por 
trabalhar com uma média, as imagens produzidas por este método são mais 
suavizadas do que o anterior. Por outro lado, feições de bordas da imagem original 
podem ser também suavizadas, perdendo contraste. Otempo de computação deste 
método é mais elevado do que o anterior. 

O terceiro método é conhecido por convolução cúbica e baseia-se no 
ajuste de uma superfície polinomial de terceiro grau (bidimensional) à região 
circundando o pixel em questão. Neste caso, os 16 vizinhos mais próximos seriam 
usados para determinar o valor do pixel hachuriado na Figura 10.3 (a, B e 7). Esta 
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técnica é consideravelmente mais complicada do que as anteriores, mas tende a 
produzirimagens com uma aparência bem mais "natural", embora alguma perda de 
feições de alta frequência acabe por ocorrer, uma vez que qualquer interpolador é 
na verdade um filtro passa baixas. 

A Tabela X.1 abaixo compara as características dos três métodos na 
interpolação do pixel hachuriado da Figura 10.3 

A escolha de qual dos métodos usar vai depender basicamente de dois 
fatores: qual o uso a ser dado à imagem corrigida e quais as facilidades de 
computação disponíveis, visto que esse processo é extremamente demorado. 
Emboraa aparência estética do método do vizinho próximo não seja a melhor, esse 
é o método que mais "preserva" o valor original do DN, uma vez que não envolve 
nenhuma média. Por isso, se a imagem vai ser submetida à uma classificação, 
certamente não é desejável que se modifique muito o valor dos DNs. Se, por outro 
lado,o propósito é a produção de uma imagem esteticamente agradável para, por 
exemplo, superpor a uma base cartográfica para comparação, o melhor é usar o 
método de convolução cúbica. 


Método Técnica Pixels Tempo Vantagens Desvantagens 
envolvidos relativo de 
no cálculo” com-putação 


Vizinho Transfere o Simples de Imagem pouco 
próximo DN do vizinho computar; estética 
mais próximo preserva o DN 
original 


Interpolação Calcula a Imagem suave; Altera o DN 
bi-linear média geometricamen do pixels 
ponderada dos te correta original 
4 vizinhos 


Convolução Utiliza uma ; Imagem Complexa de 
cúbica média usando esteticamente calcular 

os 16 vizinhos melhor 

próximos 


* Ver figura 10.3 


Tabela X.1 - Comparação entre os três métodos de reamostragem por interpolação. 
(Modif. de Curran, 1986). 


10.4 Registro de imagens 


Em sensoriamento remoto, muitas vezes a análise comparativa de imagens 
multi-temporais, ou a combinação entre imagens de diferentes sensores sobre uma 
mesma área, ou ainda a justaposição de imagens se faz necessária. Nestes casos, 
é preciso assegurar que os pixels das imagens a serem trabalhadas sejam 
referentes às mesmas área no terreno. Mesmo considerando um mesmo sensor, a 
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bordo de um mesmo satélite, dificilmente essa coincidência nos pixels ocorrerá, 
devido às distorções não sistemáticas causadas pelos movimentos do satélite. 
Portanto, antes de se combinar/comparar duas imagens de uma mesma área, é 
necessário que ambas estejam perfeitamente registradas entre si. 

Existem duas maneiras de registrar imagens: o modo automático e o modo 
manual. O modo automático baseia-se na análise da similaridade ou 
dissimilaridade entre duas imagens, que é calculada com base no deslocamento 
relativo existente entre as mesmas. A maneira como a similaridade é determinada 
baseia-se na correlação entre a mesma área nas duas imagens pois, quanto maior 
for a correlação, mais similares serão as áreas (duas áreas idênticas terão 100% 
de correlação). Esse processo é feito através de "janelas", de maneira análoga à 
filtragem por convolução. Através dessa análise é possível então identificar feições 
correspondente no terreno mostradas nas duas imagens e, subsequentemente, 
registrá-las conforme a disposição espacial dessas feições. Este é um método de 
alta precisão mas bastante demorado e que requertanto softwaresofisticado quanto 
grande capacidade de computação. 

O registro manual se baseia na identificação de pontos de controle no 
terreno, de forma semelhante à vista na correção geométrica usando GCPs, sendo 
indicado para os casos em que umagrande precisão não é necessária. Neste caso, 
porém, ao invés de registrar as coordenadas em pixel/linha de uma imagem às 
coordenadas geográficas de um mapa, vai-se registrar duas coordenadas tipo 
pixel/linha entre si. As etapas subsequentes (transformação afim, reamostragem por 
interpolação) são realizadas exatamente da mesma forma já vista. 
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